OpenAI оновлює процес демонстрації користувачам "міркування" новітньої моделі o3-mini. Тепер "ланцюжок міркувань" буде детальніший та матиме більше етапів. Про це пише TechCrunch.
When we briefed people on 🍓 before o1-preview's release, seeing the CoT live was usually the "aha" moment for them that made it clear this was going to be a big deal. These aren't the raw CoTs but it's a big step closer and I'm glad we can share that experience with the world. https://t.co/72ZpPrHmfK
— Noam Brown (@polynoamial) February 6, 2025
Моделі мислення, такі як o3-mini, ретельно перевіряють факти перед тим, як надати результат. Хоча це вимагає більше часу для підготовки відповіді, це значно підвищує їхню точність. Разом із відповіддю модель також надає коротке резюме свого процесу “мислення”.
Модель R1 від DeepSeek, своєю чергою, розкриває повний процес мислення, що, на думку багатьох дослідників ШІ, є оптимальним підходом. Окрім того, що модель легше вивчати, її кроки міркувань покращують користувацький досвід у певних ситуаціях, допомагаючи визначити, на якому етапі модель припустилась помилки.
Це спонукало OpenAI надати користувачам більше інформації про міркування моделі. Компанія все ще не показуватиме повного процесу "міркування" o3-mini, але заявила, що "знайшла баланс": o3-mini може "вільно мислити", а потім організовувати свої "думки" в більш докладні резюме.
"Щоб підвищити ясність і безпеку, ми додали додатковий етап пост-обробки, на якому модель переглядає сирий ланцюжок думок, видаляючи будь-який небезпечний вміст, а потім спрощує будь-які складні ідеї, — пояснює OpenAI. — Крім того, цей етап пост-обробки дозволяє неангломовним користувачам отримувати ланцюжок думок на їх рідній мові, створюючи більш доступний і дружній досвід".