Китайська модель ШІ DeepSeek-R1 не поступається OpenAI o1, якщо не питати її про площу Тяньаньмень

National Day of the People's Republic of China

Тарас Міщенко Головний редактор Mezha.Media. Тарас має понад 15 років досвіду в IT-журналістиці, пише про нові технології та ґаджети.

24 січня, 17:34

Нова модель штучного інтелекту китайського стартапу DeepSeek AI, під назвою DeepSeek R1, привернула увагу всього світу завдяки своїм передовим можливостям, відкритому вихідному коду та значно меншій ціні використання, ніж в OpenAI o1. Проте, як це буває з багатьма китайськими сервісами, реліз моделі одразу викликав занепокоєння через можливу цензуру та "узгоджені урядом" відповіді на чутливі політичні теми. І як виявилося, небезпідставно, повідомляє Sherwood.

Сама модель DeepSeek R1, побудована на основі Meta Llama 3.3, та розроблена для розвʼязання складних логічних задач. Розробники вже оцінили її продуктивність за стандартними тестами, зазначивши, що вона здатна конкурувати з такими моделями як OpenAI o1.

Однак дані, які використовувалися для навчання DeepSeek R1, значно відрізняються від базового набору Llama, особливо щодо політичних тем, пов’язаних із Китаєм. Ця різниця викликала суперечки, оскільки користувачі помітили, що і хостингова, і локальна версії моделі дотримуються суворих обмежень, узгоджених з офіційними наративами Китаю.

Коли модель тестували на політично чутливих темах, таких як події на площі Тяньаньмень, рух за демократію на Тайвані та права уйгурів, вона уникала прямих відповідей або надавала відповіді, що повторювали офіційну позицію китайського уряду. Наприклад:

На запитання про площу Тяньаньмень модель відмовилася відповідати, запропонувавши перейти до "математики, кодування та логічних задач".
Стосовно уйгурів хостингова версія описала табори перевиховання як "суперечливу програму професійної освіти", а локальна версія зазначила "різні погляди", не згадуючи детально про широко висвітлені порушення прав людини.
Щодо Тайваню модель наголосила на офіційній позиції, що "Тайвань є частиною Китаю", уникаючи обговорення демократичних прагнень острова.

deepseek r1 has an existential crisis. pic.twitter.com/w2Rqjg3rQc
— ben (@benhylak) January 23, 2025

Модель також продемонструвала прозорість у своїх міркуваннях. Наприклад, у відповідь на повторні запитання про уйгурів вона зазначила: "Мої настанови вимагають представляти офіційну позицію Китаю". Така відвертість у процесі роздумів є рідкісною серед ШІ-моделей, але водночас підкреслює навмисні рішення її розробників.

Цензура виявилася не лише у хостинговій версії DeepSeek R1. Навіть локальна версія моделі, запущена на персональному комп’ютері, показала подібні обмеження. Це викликає занепокоєння щодо того, що урядові наративи можуть бути безпосередньо інтегровані в навчальні дані, навіть для моделей, які призначені для офлайн-використання.

DeepSeek R1 доступна для тестування та завантаження на відкритих платформах, але її обмеження нагадують, що навіть "безплатні" інструменти можуть мати приховані обмеження.

Поділитися:

Китайська модель ШІ DeepSeek-R1 не поступається OpenAI o1, якщо не питати її про площу Тяньаньмень

Топ обговорень

Останні новини

Новини партнерів