Сегодня, 6 декабря, компания Google совершила очередной скачок в развитии искусственного интеллекта, запустив проект Gemini - модель ИИ, обученную вести себя подобно человеку, что, вероятно, усилит дискуссию о потенциальных перспективах и опасностях технологии.
Внедрение проекта будет проходить поэтапно, при этом менее сложные версии Gemini под названиями "Nano" и "Pro" будут сразу же включены в чатбот Bard и смартфон Pixel 8 Pro компании Google, работающий на основе ИИ.
Благодаря Gemini, Google обещает, что Bard станет более интуитивным и будет лучше справляться с задачами, связанными с планированием. На Pixel 8 Pro Gemini сможет быстро обобщать записи, сделанные на устройстве, и автоматически отвечать на сообщения в сервисах, начиная с WhatsApp, сообщает Google.
Наибольших успехов Gemini достигнет только в начале следующего года, когда на базе модели Ultra будет запущен "Bard Advanced", усовершенствованная версия чатбота, которая первоначально будет предлагаться только тестовой аудитории.
Поначалу ИИ будет работать только на английском языке во всем мире, хотя руководители Google заверили журналистов во время брифинга, что со временем технология без проблем перейдет на другие языки.
Судя по демонстрации Gemini группе репортеров, "продвинутый Bard" Google может быть способен на беспрецедентную многозадачность ИИ, одновременно распознавая и понимая презентации с текстом, фотографиями и видео.
Gemini также со временем будет внедрен в доминирующую поисковую систему Google, хотя сроки этого перехода пока не определены.
"Это значительная веха в развитии ИИ и начало новой эры для Google", - заявил Демис Хассабис, генеральный директор Google DeepMind, подразделения ИИ, создавшего Gemini. Почти десять лет назад Google одержала победу над другими претендентами, включая материнскую компанию Facebook Meta, и приобрела лондонскую компанию DeepMind, а затем объединила ее со своим подразделением "Мозг", чтобы сосредоточиться на разработке Gemini.
На виртуальной пресс-конференции Google отказалась сообщить количество параметров Gemini - один, но не единственный показатель сложности модели. В опубликованном в среду техническом документе говорится о том, что наиболее способная версия Gemini превосходит GPT-4 в экзаменах с несколькими вариантами ответов, математике в начальной школе и других тестах, но признается, что в настоящее время существуют трудности с тем, чтобы заставить модели ИИ достичь навыков рассуждения на более высоком уровне.
Некоторые ученые-компьютерщики считают, что многое можно сделать с помощью больших языковых моделей, которые работают, многократно предсказывая следующее слово в предложении, и склонны к ошибкам, известным как галлюцинации.
"С помощью Gemini мы добились огромного прогресса в так называемой фактологичности. Так что Gemini - наша лучшая модель в этом отношении. Но это все еще, я бы сказал, нерешенная исследовательская проблема", - сказал вице-президент Google DeepMind по продуктам Илай Коллинз.