· Seorang kepala pemburu kepala yang bertanggung jawab untuk menggali bakat teknologi tinggi di bidang model besar memberi tahu teknologi Pengpai bahwa logika penggunaan DeepSeek dan perusahaan lain di bidang model besar tidak berbeda banyak, label inti dari bakat adalah "muda berpotensi", yaitu mereka yang lahir sekitar tahun 1998, pengalaman kerja terbaik tidak melebihi lima tahun, "cerdas, ilmiah, muda, kurang pengalaman."
Menurut para ahli industri, DeepSeek lebih beruntung dibandingkan dengan perusahaan besar lainnya di dalam industri yang berfokus pada model bisnis. Tidak ada tekanan pendanaan, tidak perlu membuktikan kepada investor, dan tidak perlu mempertimbangkan pengembangan teknis model dan optimasi aplikasi produk. Namun, sebagai perusahaan komersial, setelah mengalami investasi yang besar, suatu saat nanti DeepSeek akan menghadapi tekanan dan tantangan yang dihadapi perusahaan model lain saat ini.
Pada tahun 2024, perusahaan mana yang paling populer di lingkaran model besar China? Hangzhou DeepSeek Artificial Intelligence Research Co., Ltd. (selanjutnya disebut DeepSeek) pasti menjadi pesaing yang kuat. Sebagai inisiator perang harga model besar pertengahan tahun lalu, DeepSeek memasuki perhatian publik. Setelah meluncurkan model open source DeepSeek-V3 dan model inferensi DeepSeek-R1, DeepSeek sepenuhnya memicu perdebatan di lingkaran model besar. Orang-orang terkejut dengan biaya pelatihan yang kompetitifnya (dikatakan bahwa DeepSeek-V3 hanya menghabiskan biaya pelatihan sebesar 5.576 juta dolar AS) dan memberikan tepuk tangan untuk perilaku open source model dan laporan teknis yang terbuka. Peluncuran DeepSeek-R1 membuat banyak ilmuwan, pengembang, dan pengguna sangat bersemangat, bahkan menganggap DeepSeek sebagai pesaing yang kuat bagi model inferensi seperti OpenAI o1.
Bagaimana perusahaan yang rendah hati ini dapat membuat model besar yang tidak kalah performanya dengan biaya pelatihan yang sangat rendah? Apa yang membuatnya begitu populer hari ini? Di masa depan, perusahaan ini akan menghadapi tantangan apa jika ingin terus maju di dunia 'modelling'?
Inovasi algoritma telah membuat biaya daya komputasi turun secara signifikan ###
"DeepSeek telah terlibat sejak awal, memiliki akumulasi yang besar, dan memiliki fitur unik dalam algoritma mereka sendiri." Seorang eksekutif dari perusahaan startup model besar di dalam negeri ketika berbicara tentang DeepSeek, ia mengatakan bahwa menurutnya, salah satu keunggulan inti dari DeepSeek yang membuatnya begitu populer adalah inovasi dalam algoritmanya. "Karena perusahaan-perusahaan China kekurangan daya komputasi, mereka lebih memperhatikan penghematan biaya daya komputasi daripada OpenAI."
Menurut informasi DeepSeek-R1 yang diterbitkan oleh DeepSeek, dalam tahap pasca-pelatihan, teknologi reinforcement learning digunakan secara besar-besaran, yang secara signifikan meningkatkan kemampuan penalaran model dengan hanya sedikit data yang diberi label. Dalam tugas matematika, kode, penalaran bahasa alami, dll., kinerjanya setara dengan versi resmi OpenAI o1.
Harga API DeepSeek-R1
Pendiri DeepSeek, Liang Wenfeng, telah menggarisbawahi beberapa kali bahwa DeepSeek berkomitmen untuk membuka jalur teknologi yang berbeda, bukan menyalin model OpenAI. DeepSeek harus menemukan cara yang lebih efektif untuk melatih modelnya.
"Mereka menggunakan serangkaian teknik rekayasa untuk mengoptimalkan arsitektur model, seperti penggunaan metode model campuran yang inovatif, dengan tujuan dasar untuk mengurangi biaya melalui rekayasa agar dapat menghasilkan keuntungan." Kata seorang profesional berpengalaman dalam industri teknologi kepada Pengpai Teknologi.
Berdasarkan informasi yang diungkapkan oleh DeepSeek, mereka telah membuat kemajuan signifikan dalam struktur MLA (Multi-head Latent Attention) dan model DeepSeekMOE(Mixture-of-Experts (Mixture-of-Experts yang dikembangkan sendiri), kedua desain teknologi ini dapat mengurangi sumber daya komputasi pelatihan, membuat model DeepSeek lebih efisien biaya, dan juga meningkatkan efisiensi pelatihan. Menurut data dari lembaga penelitian Epoch AI, model terbaru dari DeepSeek sangat efisien.
Dalam hal data, berbeda dengan cara "pemberian makanan data massal" OpenAI, DeepSeek menggunakan algoritma untuk merangkum dan mengklasifikasikan data, kemudian setelah diproses secara selektif, data disampaikan ke model besar, meningkatkan efisiensi pelatihan serta menurunkan biaya DeepSeek. Kemunculan DeepSeek-V3 menciptakan keseimbangan antara kinerja tinggi dan biaya rendah, memberikan kemungkinan baru bagi perkembangan model besar.
"Mungkin di masa depan tidak perlu lagi kluster GPU berukuran besar." Setelah peluncuran model berkualitas tinggi dengan harga terjangkau dari DeepSeek, pendiri OpenAI, Andrej Karpathy, mengatakan.
Liu Zhiyuan, seorang profesor tetap dari Departemen Ilmu Komputer di Universitas Tsinghua, mengatakan kepada The Paper bahwa kemunculan DeepSeek dalam lingkaran hanya membuktikan keunggulan kompetitif kami, melalui penggunaan sumber daya terbatas yang sangat efisien, untuk mencapai lebih banyak dengan lebih sedikit. Rilis R1 menunjukkan bahwa kesenjangan antara kami dan Amerika Serikat dalam kekuatan AI telah menyempit secara signifikan. The Economist juga melaporkan dalam edisi terbaru: "DeepSeek mengubah industri teknologi dengan pelatihan dan inovasi berbiaya rendah dalam desain model. ”
Chief Executive Officer dan salah satu pendiri Google DeepMind, Demis Hassabis, mengatakan bahwa meskipun belum jelas sejauh mana DeepSeek bergantung pada data pelatihan dan model open-source sistem barat, prestasi yang telah dicapai oleh tim ini memang mengesankan. Di satu sisi, ia mengakui bahwa Cina memiliki kemampuan teknik yang sangat kuat dan skalabilitas, di sisi lain, ia juga menunjukkan bahwa Barat masih memimpin dan perlu mempertimbangkan bagaimana menjaga posisi unggul model terdepan Barat.
Terakumulasi selama bertahun-tahun mencapai prestasi yang luar biasa
Alasan mengapa DeepSeek mampu mencapai inovasi ini tidak dicapai dalam sehari, tetapi merupakan hasil dari beberapa tahun "inkubasi" dan perencanaan jangka panjang. Liang Wenfeng juga merupakan pendiri kepala ekuitas swasta kuantitatif High-Flyer Quantitative. Deepseek dianggap memanfaatkan sepenuhnya dana, data, dan kartu yang diakumulasikan oleh High-Flyer Quantitative.
Liang Wenfeng lulus dari Universitas Zhejiang dengan gelar sarjana dan magister di Departemen Teknik Informasi dan Elektronika. Sejak tahun 2008, ia memimpin tim dalam menggunakan teknologi seperti pembelajaran mesin untuk menjelajahi perdagangan kuantitatif otomatis. Pada tahun 2015, didirikanlah Huansquare Quant, dan tahun berikutnya, diluncurkanlah model AI pertama yang dieksekusi secara online dengan posisi perdagangan yang dihasilkan oleh pembelajaran mendalam. Pada tahun 2018, AI ditetapkan sebagai arah pengembangan utama. Pada tahun 2020, Huansquare Quant telah menginvestasikan lebih dari 100 juta yuan dan secara resmi mengoperasikan superkomputer AI bernama 'Yinghuo No. 1' yang memiliki luas area setara dengan satu lapangan basket, yang diklaim memiliki daya komputasi super yang setara dengan 40.000 komputer pribadi. Pada tahun 2021, Huansquare menginvestasikan satu miliar yuan untuk membangun 'Yinghuo No. 2' yang dilengkapi dengan 10.000 chip GPU A100. Saat itu, di dalam negeri tidak ada lebih dari lima perusahaan yang memiliki lebih dari 10.000 GPU, dan selain Huansquare Quant, keempat perusahaan lainnya adalah perusahaan-perusahaan besar di bidang internet.
Pada bulan Juli 2023, DeepSeek resmi didirikan dan memasuki bidang kecerdasan buatan umum, hingga saat ini tidak pernah mendapatkan pendanaan eksternal.
"Ada kartu yang cukup berlimpah, tanpa tekanan pendanaan, hanya membuat model selama beberapa tahun belakangan ini tanpa membuat produk, membuat DeepSeek terlihat lebih sederhana dan fokus dibandingkan dengan perusahaan besar lainnya di dalam negeri, dapat membuat terobosan dalam teknik rekayasa dan algoritma." kata eksekutif senior perusahaan besar di dalam negeri tersebut.
Selain itu, ketika industri model besar semakin menuju ke arah tertutup, OpenAI dijuluki CloseAI, perilaku DeepSeek dalam mengopen source model dan laporan teknis secara publik juga mendapat pujian dari para pengembang, sehingga merek teknologi mereka cepat menjadi sorotan di pasar model besar dalam dan luar negeri.
Seorang peneliti mengatakan kepada Pengpai Teknologi bahwa keterbukaan DeepSeek sangat luar biasa, sumber terbuka model V3 dan R1 meningkatkan standar tingkat dasar model sumber terbuka di pasar.
berhasil membuktikan kekuatan generasi muda
"Keberhasilan yang dicapai oleh DeekSeek juga membuat kita melihat kekuatan generasi muda, pada dasarnya perkembangan kecerdasan buatan generasi ini lebih membutuhkan pikiran yang muda," kata seorang pejabat perusahaan model kepada Pengpai Teknologi.
Sebelumnya, mantan Kepala Kebijakan OpenAI dan salah satu pendiri Anthropic, Jack Clark, berpendapat bahwa DeepSeek telah merekrut 'sekelompok jenius yang penuh misteri'. Namun, dalam wawancara dengan media sosial, Liang Wenfeng mengatakan bahwa tidak ada jenius yang penuh misteri, tetapi semua orang berasal dari lulusan universitas terkemuka di dalam negeri, mahasiswa magister dan doktor yang belum lulus, serta beberapa orang muda yang baru lulus beberapa tahun.
Dari laporan media yang sudah ada, dapat dilihat bahwa tim DeepSeek memiliki ciri khas terbesar yaitu berasal dari universitas terkemuka dan usia muda, bahkan untuk tingkat pemimpin tim, usianya kebanyakan di bawah 35 tahun. Tim yang terdiri dari kurang dari 140 orang, hampir semua insinyur dan pengembang berasal dari universitas terkemuka di dalam negeri seperti Universitas Tsinghua, Universitas Peking, Universitas Sun Yat-sen, dan Universitas Pos dan Telekomunikasi Beijing, dan mereka belum bekerja untuk waktu yang lama.
Seorang kepala pencari bakat teknologi tinggi di bidang model besar yang bertanggung jawab memberitahu Teknologi Pengurangan bahwa logika penggunaan tenaga DeepSeek dan perusahaan lain di bidang model besar hampir sama, label inti untuk bakat adalah 'muda dan potensial', yaitu orang yang lahir sekitar tahun 1998, dengan pengalaman kerja yang lebih baik tidak lebih dari lima tahun, 'cerdas, ilmu pengetahuan dan teknologi, muda, dan memiliki sedikit pengalaman'.
Namun, kepala pencari pun mengatakan, perusahaan rintisan besar pada dasarnya tetap merupakan perusahaan rintisan, bukan tidak ingin merekrut bakat AI terbaik dari luar negeri, namun kenyataannya adalah bahwa tidak banyak bakat AI terbaik dari luar negeri yang bersedia kembali.
Seorang karyawan DeepSeek yang enggan menyebutkan namanya kepada Penebang Teknologi mengungkapkan bahwa manajemen perusahaan sangat datar, dan suasana komunikasi bebas cukup baik. Liang Wenfeng biasanya tidak menentu, sebagian besar waktu semua orang berkomunikasi dengannya secara online.
Karyawan ini sebelumnya bekerja di pabrik besar di dalam negeri untuk pengembangan teknologi model besar, tetapi merasa lebih seperti sekrup di pabrik besar dan tidak bisa menciptakan nilai, akhirnya memutuskan bergabung dengan DeepSeek. Menurutnya, saat ini DeepSeek lebih fokus pada teknologi model dasar.
At DeepSeek, the working atmosphere is completely bottom-up, naturally divided, and there is no limit to everyone's adjustments to cards and people. "Bring your own ideas, no need for push. In the exploration process, when he encounters problems, he will discuss them with others." Liang Wenfeng said in a previous interview.
"Merasa bahwa AI China telah melampaui Amerika lebih awal"
Media bisnis AS Business Insider menganalisis bahwa perilisan R1 menunjukkan bahwa Tiongkok dapat bersaing dengan beberapa model kecerdasan buatan terkemuka di industri dan tetap sejajar dengan perkembangan terdepan di Silicon Valley AS; selain itu, kecerdasan buatan open source yang canggih ini juga dapat menantang perusahaan-perusahaan yang berusaha mendapatkan keuntungan besar dengan menjual teknologi.
Namun, saat ini terlalu cepat untuk bersorak 'AI China telah melampaui Amerika'. Liu Zhiyuan secara terbuka menyatakan bahwa perlu waspada terhadap opini publik yang berubah dari sangat pesimis menjadi sangat optimis, merasa bahwa kita telah melampaui secara menyeluruh dan unggul jauh, namun 'jauh dari itu'. Liu Zhiyuan berpendapat bahwa teknologi AGI saat ini masih berkembang dengan cepat, jalur pengembangan masa depan belum jelas, dan China masih dalam tahap mengejar, meskipun bukan lagi tertinggal, namun juga hanya bisa dikatakan cukup mengejar, 'mengikuti lari cepat di jalan yang sudah dieksplorasi orang lain masih relatif mudah, tetapi bagaimana melangkah maju dalam kabut, itulah tantangan yang lebih besar'.
"Sekarang terlalu kacau, semuanya terlalu terburu-buru, tidak menyadari bahwa DeepSeek akhirnya keluar." Orang yang dekat dengan DeepSeek mengungkapkan kepada Pengpai Technology bahwa kecepatan perubahan industri terlalu cepat, tidak dapat memprediksi apa yang bisa dilakukan selanjutnya, hanya bisa melihat perubahan di kuartal Q3 berikutnya.
Di satu sisi, Demis Hassabis mengakui bahwa Tiongkok memiliki kemampuan rekayasa yang sangat kuat dan kemampuan skala besar, sementara di sisi lain, ia juga menunjukkan bahwa Barat masih memimpin dan perlu mempertimbangkan bagaimana menjaga posisi unggul model-model terdepan Barat.
Meskipun Liang Wenfeng sebelumnya mengatakan kepada dunia luar bahwa DeepSeek hanya membuat model dan bukan produk. Tetapi sebagai perusahaan komersial, hampir tidak mungkin hanya membuat model dan bukan produk sepanjang waktu. Pada tanggal 15 Januari, Aplikasi DeepSeek resmi secara resmi dirilis. Orang-orang yang dekat dengan DeepSeek mengatakan kepada The Paper bahwa komersialisasi telah dimasukkan dalam agenda oleh DeepSeek.
Menurut para profesional di industri ini, dibandingkan dengan perusahaan besar lainnya di dalam negeri, DeepSeek dianggap beruntung karena tidak memiliki tekanan pendanaan, tidak perlu membuktikan diri kepada investor, dan tidak perlu memperhatikan iterasi teknis model dan optimalisasi aplikasi produk. Namun, sebagai perusahaan komersial, setelah investasi besar, suatu saat nanti akan menghadapi tekanan dan tantangan yang dihadapi perusahaan model lain saat ini. "Keluaran kali ini berhasil menjadi pemasaran yang sukses bagi DeepSeek menjelang komersialisasi, namun di masa depan, setelah benar-benar komersial, perlu menerima uji coba pasar, masih sulit untuk menentukan apakah dapat terus maju dengan sukses," kata profesional perusahaan model tersebut.
Yang pasti, DeepSeek akan menghadapi tekanan dan tantangan yang lebih besar di masa depan, persaingan menuju model yang umum baru saja dimulai, dan siapa yang bisa bertahan tergantung pada investasi yang berkelanjutan dalam dana dan iterasi teknologi. Tetapi para ahli industri juga sepakat bahwa 'untuk industri model domestik, memiliki perusahaan seperti DeepSeek yang memiliki kekuatan teknologi yang sebenarnya adalah hal yang baik.'
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Apakah DeepSeek bisa terus berkembang?
Penulis: Yu Yan, jurnalis Pengpai News
· Seorang kepala pemburu kepala yang bertanggung jawab untuk menggali bakat teknologi tinggi di bidang model besar memberi tahu teknologi Pengpai bahwa logika penggunaan DeepSeek dan perusahaan lain di bidang model besar tidak berbeda banyak, label inti dari bakat adalah "muda berpotensi", yaitu mereka yang lahir sekitar tahun 1998, pengalaman kerja terbaik tidak melebihi lima tahun, "cerdas, ilmiah, muda, kurang pengalaman."
Menurut para ahli industri, DeepSeek lebih beruntung dibandingkan dengan perusahaan besar lainnya di dalam industri yang berfokus pada model bisnis. Tidak ada tekanan pendanaan, tidak perlu membuktikan kepada investor, dan tidak perlu mempertimbangkan pengembangan teknis model dan optimasi aplikasi produk. Namun, sebagai perusahaan komersial, setelah mengalami investasi yang besar, suatu saat nanti DeepSeek akan menghadapi tekanan dan tantangan yang dihadapi perusahaan model lain saat ini.
Pada tahun 2024, perusahaan mana yang paling populer di lingkaran model besar China? Hangzhou DeepSeek Artificial Intelligence Research Co., Ltd. (selanjutnya disebut DeepSeek) pasti menjadi pesaing yang kuat. Sebagai inisiator perang harga model besar pertengahan tahun lalu, DeepSeek memasuki perhatian publik. Setelah meluncurkan model open source DeepSeek-V3 dan model inferensi DeepSeek-R1, DeepSeek sepenuhnya memicu perdebatan di lingkaran model besar. Orang-orang terkejut dengan biaya pelatihan yang kompetitifnya (dikatakan bahwa DeepSeek-V3 hanya menghabiskan biaya pelatihan sebesar 5.576 juta dolar AS) dan memberikan tepuk tangan untuk perilaku open source model dan laporan teknis yang terbuka. Peluncuran DeepSeek-R1 membuat banyak ilmuwan, pengembang, dan pengguna sangat bersemangat, bahkan menganggap DeepSeek sebagai pesaing yang kuat bagi model inferensi seperti OpenAI o1.
Bagaimana perusahaan yang rendah hati ini dapat membuat model besar yang tidak kalah performanya dengan biaya pelatihan yang sangat rendah? Apa yang membuatnya begitu populer hari ini? Di masa depan, perusahaan ini akan menghadapi tantangan apa jika ingin terus maju di dunia 'modelling'?
Inovasi algoritma telah membuat biaya daya komputasi turun secara signifikan ###
"DeepSeek telah terlibat sejak awal, memiliki akumulasi yang besar, dan memiliki fitur unik dalam algoritma mereka sendiri." Seorang eksekutif dari perusahaan startup model besar di dalam negeri ketika berbicara tentang DeepSeek, ia mengatakan bahwa menurutnya, salah satu keunggulan inti dari DeepSeek yang membuatnya begitu populer adalah inovasi dalam algoritmanya. "Karena perusahaan-perusahaan China kekurangan daya komputasi, mereka lebih memperhatikan penghematan biaya daya komputasi daripada OpenAI."
Menurut informasi DeepSeek-R1 yang diterbitkan oleh DeepSeek, dalam tahap pasca-pelatihan, teknologi reinforcement learning digunakan secara besar-besaran, yang secara signifikan meningkatkan kemampuan penalaran model dengan hanya sedikit data yang diberi label. Dalam tugas matematika, kode, penalaran bahasa alami, dll., kinerjanya setara dengan versi resmi OpenAI o1.
Pendiri DeepSeek, Liang Wenfeng, telah menggarisbawahi beberapa kali bahwa DeepSeek berkomitmen untuk membuka jalur teknologi yang berbeda, bukan menyalin model OpenAI. DeepSeek harus menemukan cara yang lebih efektif untuk melatih modelnya.
"Mereka menggunakan serangkaian teknik rekayasa untuk mengoptimalkan arsitektur model, seperti penggunaan metode model campuran yang inovatif, dengan tujuan dasar untuk mengurangi biaya melalui rekayasa agar dapat menghasilkan keuntungan." Kata seorang profesional berpengalaman dalam industri teknologi kepada Pengpai Teknologi.
Berdasarkan informasi yang diungkapkan oleh DeepSeek, mereka telah membuat kemajuan signifikan dalam struktur MLA (Multi-head Latent Attention) dan model DeepSeekMOE(Mixture-of-Experts (Mixture-of-Experts yang dikembangkan sendiri), kedua desain teknologi ini dapat mengurangi sumber daya komputasi pelatihan, membuat model DeepSeek lebih efisien biaya, dan juga meningkatkan efisiensi pelatihan. Menurut data dari lembaga penelitian Epoch AI, model terbaru dari DeepSeek sangat efisien.
Dalam hal data, berbeda dengan cara "pemberian makanan data massal" OpenAI, DeepSeek menggunakan algoritma untuk merangkum dan mengklasifikasikan data, kemudian setelah diproses secara selektif, data disampaikan ke model besar, meningkatkan efisiensi pelatihan serta menurunkan biaya DeepSeek. Kemunculan DeepSeek-V3 menciptakan keseimbangan antara kinerja tinggi dan biaya rendah, memberikan kemungkinan baru bagi perkembangan model besar.
"Mungkin di masa depan tidak perlu lagi kluster GPU berukuran besar." Setelah peluncuran model berkualitas tinggi dengan harga terjangkau dari DeepSeek, pendiri OpenAI, Andrej Karpathy, mengatakan.
Liu Zhiyuan, seorang profesor tetap dari Departemen Ilmu Komputer di Universitas Tsinghua, mengatakan kepada The Paper bahwa kemunculan DeepSeek dalam lingkaran hanya membuktikan keunggulan kompetitif kami, melalui penggunaan sumber daya terbatas yang sangat efisien, untuk mencapai lebih banyak dengan lebih sedikit. Rilis R1 menunjukkan bahwa kesenjangan antara kami dan Amerika Serikat dalam kekuatan AI telah menyempit secara signifikan. The Economist juga melaporkan dalam edisi terbaru: "DeepSeek mengubah industri teknologi dengan pelatihan dan inovasi berbiaya rendah dalam desain model. ”
Chief Executive Officer dan salah satu pendiri Google DeepMind, Demis Hassabis, mengatakan bahwa meskipun belum jelas sejauh mana DeepSeek bergantung pada data pelatihan dan model open-source sistem barat, prestasi yang telah dicapai oleh tim ini memang mengesankan. Di satu sisi, ia mengakui bahwa Cina memiliki kemampuan teknik yang sangat kuat dan skalabilitas, di sisi lain, ia juga menunjukkan bahwa Barat masih memimpin dan perlu mempertimbangkan bagaimana menjaga posisi unggul model terdepan Barat.
Terakumulasi selama bertahun-tahun mencapai prestasi yang luar biasa
Alasan mengapa DeepSeek mampu mencapai inovasi ini tidak dicapai dalam sehari, tetapi merupakan hasil dari beberapa tahun "inkubasi" dan perencanaan jangka panjang. Liang Wenfeng juga merupakan pendiri kepala ekuitas swasta kuantitatif High-Flyer Quantitative. Deepseek dianggap memanfaatkan sepenuhnya dana, data, dan kartu yang diakumulasikan oleh High-Flyer Quantitative.
Liang Wenfeng lulus dari Universitas Zhejiang dengan gelar sarjana dan magister di Departemen Teknik Informasi dan Elektronika. Sejak tahun 2008, ia memimpin tim dalam menggunakan teknologi seperti pembelajaran mesin untuk menjelajahi perdagangan kuantitatif otomatis. Pada tahun 2015, didirikanlah Huansquare Quant, dan tahun berikutnya, diluncurkanlah model AI pertama yang dieksekusi secara online dengan posisi perdagangan yang dihasilkan oleh pembelajaran mendalam. Pada tahun 2018, AI ditetapkan sebagai arah pengembangan utama. Pada tahun 2020, Huansquare Quant telah menginvestasikan lebih dari 100 juta yuan dan secara resmi mengoperasikan superkomputer AI bernama 'Yinghuo No. 1' yang memiliki luas area setara dengan satu lapangan basket, yang diklaim memiliki daya komputasi super yang setara dengan 40.000 komputer pribadi. Pada tahun 2021, Huansquare menginvestasikan satu miliar yuan untuk membangun 'Yinghuo No. 2' yang dilengkapi dengan 10.000 chip GPU A100. Saat itu, di dalam negeri tidak ada lebih dari lima perusahaan yang memiliki lebih dari 10.000 GPU, dan selain Huansquare Quant, keempat perusahaan lainnya adalah perusahaan-perusahaan besar di bidang internet.
Pada bulan Juli 2023, DeepSeek resmi didirikan dan memasuki bidang kecerdasan buatan umum, hingga saat ini tidak pernah mendapatkan pendanaan eksternal.
"Ada kartu yang cukup berlimpah, tanpa tekanan pendanaan, hanya membuat model selama beberapa tahun belakangan ini tanpa membuat produk, membuat DeepSeek terlihat lebih sederhana dan fokus dibandingkan dengan perusahaan besar lainnya di dalam negeri, dapat membuat terobosan dalam teknik rekayasa dan algoritma." kata eksekutif senior perusahaan besar di dalam negeri tersebut.
Selain itu, ketika industri model besar semakin menuju ke arah tertutup, OpenAI dijuluki CloseAI, perilaku DeepSeek dalam mengopen source model dan laporan teknis secara publik juga mendapat pujian dari para pengembang, sehingga merek teknologi mereka cepat menjadi sorotan di pasar model besar dalam dan luar negeri.
Seorang peneliti mengatakan kepada Pengpai Teknologi bahwa keterbukaan DeepSeek sangat luar biasa, sumber terbuka model V3 dan R1 meningkatkan standar tingkat dasar model sumber terbuka di pasar.
berhasil membuktikan kekuatan generasi muda
"Keberhasilan yang dicapai oleh DeekSeek juga membuat kita melihat kekuatan generasi muda, pada dasarnya perkembangan kecerdasan buatan generasi ini lebih membutuhkan pikiran yang muda," kata seorang pejabat perusahaan model kepada Pengpai Teknologi.
Sebelumnya, mantan Kepala Kebijakan OpenAI dan salah satu pendiri Anthropic, Jack Clark, berpendapat bahwa DeepSeek telah merekrut 'sekelompok jenius yang penuh misteri'. Namun, dalam wawancara dengan media sosial, Liang Wenfeng mengatakan bahwa tidak ada jenius yang penuh misteri, tetapi semua orang berasal dari lulusan universitas terkemuka di dalam negeri, mahasiswa magister dan doktor yang belum lulus, serta beberapa orang muda yang baru lulus beberapa tahun.
Dari laporan media yang sudah ada, dapat dilihat bahwa tim DeepSeek memiliki ciri khas terbesar yaitu berasal dari universitas terkemuka dan usia muda, bahkan untuk tingkat pemimpin tim, usianya kebanyakan di bawah 35 tahun. Tim yang terdiri dari kurang dari 140 orang, hampir semua insinyur dan pengembang berasal dari universitas terkemuka di dalam negeri seperti Universitas Tsinghua, Universitas Peking, Universitas Sun Yat-sen, dan Universitas Pos dan Telekomunikasi Beijing, dan mereka belum bekerja untuk waktu yang lama.
Seorang kepala pencari bakat teknologi tinggi di bidang model besar yang bertanggung jawab memberitahu Teknologi Pengurangan bahwa logika penggunaan tenaga DeepSeek dan perusahaan lain di bidang model besar hampir sama, label inti untuk bakat adalah 'muda dan potensial', yaitu orang yang lahir sekitar tahun 1998, dengan pengalaman kerja yang lebih baik tidak lebih dari lima tahun, 'cerdas, ilmu pengetahuan dan teknologi, muda, dan memiliki sedikit pengalaman'.
Namun, kepala pencari pun mengatakan, perusahaan rintisan besar pada dasarnya tetap merupakan perusahaan rintisan, bukan tidak ingin merekrut bakat AI terbaik dari luar negeri, namun kenyataannya adalah bahwa tidak banyak bakat AI terbaik dari luar negeri yang bersedia kembali.
Seorang karyawan DeepSeek yang enggan menyebutkan namanya kepada Penebang Teknologi mengungkapkan bahwa manajemen perusahaan sangat datar, dan suasana komunikasi bebas cukup baik. Liang Wenfeng biasanya tidak menentu, sebagian besar waktu semua orang berkomunikasi dengannya secara online.
Karyawan ini sebelumnya bekerja di pabrik besar di dalam negeri untuk pengembangan teknologi model besar, tetapi merasa lebih seperti sekrup di pabrik besar dan tidak bisa menciptakan nilai, akhirnya memutuskan bergabung dengan DeepSeek. Menurutnya, saat ini DeepSeek lebih fokus pada teknologi model dasar.
At DeepSeek, the working atmosphere is completely bottom-up, naturally divided, and there is no limit to everyone's adjustments to cards and people. "Bring your own ideas, no need for push. In the exploration process, when he encounters problems, he will discuss them with others." Liang Wenfeng said in a previous interview.
"Merasa bahwa AI China telah melampaui Amerika lebih awal"
Media bisnis AS Business Insider menganalisis bahwa perilisan R1 menunjukkan bahwa Tiongkok dapat bersaing dengan beberapa model kecerdasan buatan terkemuka di industri dan tetap sejajar dengan perkembangan terdepan di Silicon Valley AS; selain itu, kecerdasan buatan open source yang canggih ini juga dapat menantang perusahaan-perusahaan yang berusaha mendapatkan keuntungan besar dengan menjual teknologi.
Namun, saat ini terlalu cepat untuk bersorak 'AI China telah melampaui Amerika'. Liu Zhiyuan secara terbuka menyatakan bahwa perlu waspada terhadap opini publik yang berubah dari sangat pesimis menjadi sangat optimis, merasa bahwa kita telah melampaui secara menyeluruh dan unggul jauh, namun 'jauh dari itu'. Liu Zhiyuan berpendapat bahwa teknologi AGI saat ini masih berkembang dengan cepat, jalur pengembangan masa depan belum jelas, dan China masih dalam tahap mengejar, meskipun bukan lagi tertinggal, namun juga hanya bisa dikatakan cukup mengejar, 'mengikuti lari cepat di jalan yang sudah dieksplorasi orang lain masih relatif mudah, tetapi bagaimana melangkah maju dalam kabut, itulah tantangan yang lebih besar'.
"Sekarang terlalu kacau, semuanya terlalu terburu-buru, tidak menyadari bahwa DeepSeek akhirnya keluar." Orang yang dekat dengan DeepSeek mengungkapkan kepada Pengpai Technology bahwa kecepatan perubahan industri terlalu cepat, tidak dapat memprediksi apa yang bisa dilakukan selanjutnya, hanya bisa melihat perubahan di kuartal Q3 berikutnya.
Di satu sisi, Demis Hassabis mengakui bahwa Tiongkok memiliki kemampuan rekayasa yang sangat kuat dan kemampuan skala besar, sementara di sisi lain, ia juga menunjukkan bahwa Barat masih memimpin dan perlu mempertimbangkan bagaimana menjaga posisi unggul model-model terdepan Barat.
Meskipun Liang Wenfeng sebelumnya mengatakan kepada dunia luar bahwa DeepSeek hanya membuat model dan bukan produk. Tetapi sebagai perusahaan komersial, hampir tidak mungkin hanya membuat model dan bukan produk sepanjang waktu. Pada tanggal 15 Januari, Aplikasi DeepSeek resmi secara resmi dirilis. Orang-orang yang dekat dengan DeepSeek mengatakan kepada The Paper bahwa komersialisasi telah dimasukkan dalam agenda oleh DeepSeek.
Menurut para profesional di industri ini, dibandingkan dengan perusahaan besar lainnya di dalam negeri, DeepSeek dianggap beruntung karena tidak memiliki tekanan pendanaan, tidak perlu membuktikan diri kepada investor, dan tidak perlu memperhatikan iterasi teknis model dan optimalisasi aplikasi produk. Namun, sebagai perusahaan komersial, setelah investasi besar, suatu saat nanti akan menghadapi tekanan dan tantangan yang dihadapi perusahaan model lain saat ini. "Keluaran kali ini berhasil menjadi pemasaran yang sukses bagi DeepSeek menjelang komersialisasi, namun di masa depan, setelah benar-benar komersial, perlu menerima uji coba pasar, masih sulit untuk menentukan apakah dapat terus maju dengan sukses," kata profesional perusahaan model tersebut.
Yang pasti, DeepSeek akan menghadapi tekanan dan tantangan yang lebih besar di masa depan, persaingan menuju model yang umum baru saja dimulai, dan siapa yang bisa bertahan tergantung pada investasi yang berkelanjutan dalam dana dan iterasi teknologi. Tetapi para ahli industri juga sepakat bahwa 'untuk industri model domestik, memiliki perusahaan seperti DeepSeek yang memiliki kekuatan teknologi yang sebenarnya adalah hal yang baik.'