Випуск Qwen 2.5-Max відбувся на день, коли китайці святкують свій Місячний Новий рік. Це особливий час, коли багато людей беруть відпустки від роботи, щоб насолодитися моментами з родиною.
"Qwen 2.5-Max перевершує... майже за всіма показниками GPT-4o, DeepSeek-V3 і Llama-3.1-405B", -- йдеться в оголошенні хмарного підрозділу Alibaba, опублікованому в офіційному акаунті WeChat, з посиланням на передові моделі штучного інтелекту з відкритим вихідним кодом OpenAI та Meta.
Випуск штучного інтелекту DeepSeek на основі моделі DeepSeek-V3 10 січня, а також реліз моделі R1 20 січня, справили значний вплив на Кремнієву долину, призвівши до зниження вартості акцій технологічних компаній. Інвестори почали сумніватися у масштабних витратах провідних американських компаній у сфері штучного інтелекту, оскільки, як вважається, низькі витрати китайського стартапу на розробку та впровадження технологій стали причиною цього занепокоєння.
Проте досягнення DeepSeek стало каталізатором для її внутрішніх конкурентів, які почали активно поліпшувати свої моделі штучного інтелекту.
Через два дні після випуску DeepSeek-R1 власник TikTok ByteDance випустив оновлення своєї флагманської моделі ІІ, яка, за його словами, перевершила підтримувану Microsoft модель OpenAI o1 в AIME -- еталонному тесті, який вимірює, наскільки добре моделі ІІ розуміють і реагують на складні інструкції.
Це нагадує про твердження компанії DeepSeek, що їхня модель R1 змагається з o1 від OpenAI за різними критеріями ефективності.
Наступник моделі DeepSeek V3, DeepSeek-V2, викликав цінову конкуренцію серед штучного інтелекту в Китаї після свого debut у травні минулого року.
Той факт, що DeepSeek-V2 мав відкритий вихідний код і був безпрецедентно дешевим -- всього 1 юань (0,14 дол. США) за 1 мільйон токенів (або одиниць даних, що обробляються моделлю ІІ), -- привів до того, що хмарний підрозділ Alibaba оголосив про зниження цін до 97% на низку моделей.
Інші технологічні підприємства Китаю пішли за цим прикладом, серед яких Baidu та найбільш коштовна інтернет-компанія в країні – Tencent.
Лян Веньфен, засновник DeepSeek, заявив в інтерв'ю китайському ЗМІ Waves у липні, що стартап "не турбують" цінові війни і що його головною метою є досягнення AGI (штучного інтелекту загального призначення).
Тоді як у великих китайських технологічних компаніях, таких як Alibaba, працюють сотні тисяч співробітників, DeepSeek діє як дослідницька лабораторія, в якій працюють переважно молоді випускники та докторанти провідних китайських університетів.
У липневому інтерв'ю Лян висловив думку, що провідні технологічні компанії Китаю можуть не вписуватися в майбутнє індустрії штучного інтелекту. Він порівняв їхні значні витрати та жорстку вертикальну структуру з більш гнучким управлінським стилем і дбайливим підходом до бізнесу, який використовує DeepSeek.
"Великі фундаментальні моделі вимагають постійних інновацій, можливості технологічних гігантів мають свої межі", -- зазначив Веньфен.
Нагадаємо, що нещодавнє випускання відкритої моделі штучного інтелекту DeepSeek-R1, розробленої китайською компанією DeepSeek, стало важливим кроком у відповідь на обмеження, які США запровадили щодо доступу Китаю до передових технологічних розробок.
#Microsoft #Університет #Модель #Новий рік #Інновації #Стартап-компанія #OpenAI #Штучний інтелект #Хмарні обчислення #Інвестор #Китай (регіон) #Ханьська мова. #Юань Женьміньбі #Мета-платформи #Програмне забезпечення з відкритим кодом #Alibaba Group #Baidu #Силіконова долина #Китайський Новий рік #Tencent