banner 728x250

Mengenal DeepSeek, Open Source AI yang Unggul Dibanding ChatGPT hingga Llama

banner 120x600
banner 468x60

Perusahaan Cina DeepSeek merilis DeepSeek V3, model AI terbuka sumber sejak akhir tahun lalu. Dibandingkan dengan model AI lainnya, DeepSeek menduduki hampir seluruh indeks ukur.

Menurut laman resmi DeepSeek, model AI ini memiliki total 671 juta parameter. Angka ini jauh lebih tinggi dari Llama 3.1, yang dibuat oleh Meta, dan memiliki total parameter 405 juta. Jumlah parameter ini mampu menjadikannya model AI terbuka dengan parameter tertinggi.

banner 325x300

Parameter adalah variabel internal yang digunakan model untuk membuat prediksi atau keputusan. TechCrunch menulis bahwa jumlah parameter biasanya berkorelasi dengan keterampilan. Model dengan lebih banyak parameter cenderung unggul daripada model dengan parameter sedikit.

“Tetapi, model yang lebih besar juga perlu perangkat keras yang lebih kuat untuk dapat menjalankan dengan lancar. Versi DeepSeek V3 yang tidak dioptimalkan akan memerlukan sejumlah kartu grafis kelas atas untuk menjawab pertanyaan dengan kecepatan yang tepat,” tulis TechCrunch, dilansir Senin (6/1)

Di kompetisi pengodean di platform Codeforces, sebuah platform kontes pemrograman, DeepSeek memenangkan sebagian kompetisi itu, mengungguli model lain seperti Llama 3.1 405B milik Meta, GPT-4o milik OpenAI, dan Qwen 2.5 72B milik Alibaba.

DeepSeek V3 juga mengalahkan pesaingnya pada Aider Polyglot, sebuah pengujian yang dirancang untuk mengukur, antara lain, apakah sebuah model yang dikembangkan dapat berhasil menulis kode baru yang berintegrasi dengan kode yang sudah ada.

Model versi ketiga ini tiga kali lebih cepat dari model sebelumnya, sehingga dapat memproses 60 token per detik. Perusahaan juga mengklaim bahwa DeepSeek V3 telah dilatih dengan menggunakan dataset 14,8 triliun token.

Di dalam ilmu data alias data science, token digunakan untuk mewakili berkas data mentah. Satu juta token setara dengan sekitar 750.000 kata.

banner 325x300

Leave a Reply

Your email address will not be published. Required fields are marked *