HANGZHOU, SINKAP.info — Alibaba resmi meluncurkan Qwen3, generasi terbaru dari keluarga model bahasa besar (large language model/LLM) open source miliknya. Qwen3 diklaim menetapkan standar baru dalam pengembangan AI dengan mengusung teknologi hybrid reasoning.
Seri Qwen3 mencakup enam model dense (0,6B, 1,7B, 4B, 8B, 14B, dan 32B parameter) serta dua model Mixture-of-Experts (MoE), yaitu Qwen3-30B-A3B dan Qwen3-235B-A22B. Seluruh model ini kini tersedia secara open source dan dapat diakses secara global melalui platform seperti Hugging Face, GitHub, dan ModelScope.
Kemampuan Hybrid Reasoning
Fitur unggulan dari Qwen3 adalah kemampuan hybrid reasoning, yakni perpaduan mode berpikir (thinking) untuk tugas kompleks seperti matematika dan pemrograman, serta mode non-berpikir (non-thinking) untuk respons cepat dan umum. Untuk pengembang yang mengakses via API, tersedia pengaturan durasi berpikir hingga 38 ribu token, memungkinkan pengoptimalan kinerja dan efisiensi komputasi.
Model Qwen3-235B-A22B disebut memiliki efisiensi biaya implementasi yang lebih rendah dibandingkan model-model sekelasnya, memperkuat komitmen Alibaba dalam menghadirkan AI yang terjangkau dan berkinerja tinggi.
Peningkatan Kemampuan Multibahasa dan Reasoning
Dilatih menggunakan dataset sebesar 36 triliun token dua kali lipat dari pendahulunya Qwen2.5—Qwen3 menunjukkan kemajuan signifikan dalam pemahaman multibahasa, penyelesaian tugas berbasis instruksi, hingga penggunaan alat bantu (function calling).
Beberapa kemampuan utama Qwen3 meliputi:
Dukungan 119 bahasa dan dialek, termasuk penerjemahan dan eksekusi instruksi multibahasa.
Integrasi Agen AI melalui dukungan protokol Model Context Protocol (MCP).
Reasoning superior dalam matematika, pengkodean, dan logika, melampaui Qwen2.5.
Peningkatan interaksi manusiawi, termasuk penulisan kreatif dan percakapan multi putaran yang lebih alami.
Pencapaian Benchmark dan Penerapan Global
Qwen3 mencetak hasil unggul dalam berbagai benchmark industri seperti AIME25 (matematika), LiveCodeBench (pengkodean), BFCL (function calling), dan Arena Hard (instruksi LLM). Model ini dikembangkan melalui empat tahap pelatihan: cold start dengan long chain-of-thought (CoT), reinforcement learning berbasis penalaran, thinking mode fusion, dan general RL.
Qwen3 juga menjadi basis dari aplikasi AI unggulan Alibaba, Quark, dan akan tersedia melalui platform Model Studio.
Sejak pertama kali diperkenalkan, model Qwen telah diunduh lebih dari 300 juta kali secara global. Lebih dari 100.000 model turunan berbasis Qwen telah dibuat oleh komunitas pengembang, menjadikan Qwen salah satu seri LLM open source paling banyak diadopsi di dunia.