На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

AdIndex

3 310 подписчиков

Свежие комментарии

  • Галина Друзина
    Что значит, могут запретить рекламировать многожёнства, без слова могут, не лгбт, так многожёнства, запад никак не ус...В России могут за...
  • Алекс Кузь
    Тц - удивительные памятники эпохе глупого бизнеса . Пользы от этих громных Сараев никакого нет, кроме , приличных общ...Посещаемость торг...
  • Вовладар Даров
    Какие россияне, уточните! Которые работают на трёх работах?Россияне стали ча...

Нейросети «Яндекса» столкнулись с дефицитом текстов на различных языках

Нейросети «Яндекса» испытывают нехватку текстов на экзотических языках, что

ухудшает качество работы ИИ, пишут

«Ведомости» со ссылкой на директора по развитию технологий

ИИ «Яндекса» Александра Крайнова. Разработчики моделей машинного обучения (LLM)

сталкиваются с проблемой во время работы.

Чтобы обучить языковую модель, нужно найти много хороших текстов, поясняет

Крайнов. Он уточняет, что такого объема нет физически. На английском языке их

достаточно, даже избыточно. На русском компания собирает все, что может

получить. Однако если говорить об узбекском, таджикском или казахском языках,

то «их не просто недостаточно — их нет».

Наличие такой проблемы подтверждает менеджер ИИ-продуктов Just AI Алексей

Борщов. Он акцентирует внимание на том, что есть сложности с диалектами,

редкими языками и языками с ограниченным объемом текстовых данных. Крайнов

допускает, что уровень и качество работы языковых моделей могут стать ниже,

если не будет хватать обучающих данных.

 

Ссылка на первоисточник

Картина дня

наверх