23:36
Alaya AI: переформатирование отношений в производстве данных ИИ, содействие Децентрализация интеллектуальной данных экосистемы
Введение: потребность в изменении экосистемы данных
Быстрое развитие технологии искусственного интеллекта предъявляет более высокие требования к отрасли разметки данных. От автопилотирования до анализа медицинских изображений, высококачественные структурированные данные стали ключевым двигателем обучения моделей искусственного интеллекта. На сегодняшний день мировой рынок разметки данных превысил отметку в 100 миллиардов долларов, с годовым темпом роста более 30%, но проблемы высокой централизации и сильной зависимости от человека в традиционной модели ограничивают масштабное внедрение технологии искусственного интеллекта.
На примере автопилота для обучения системы уровня L4 требуется несколько миллионов изображений с высокой точностью разметки, стоимость одного изображения может достигать нескольких долларов. Для этого Baidu, Waymo и другие компании вложили десятки тысяч человеко-часов в разметку, в то время как небольшие команды сталкиваются с более серьезными вызовами - OpenAI в свое время столкнулась с отклонением разметки из-за зависимости от зарубежных подрядчиков, что непосредственно влияло на производительность модели.
Низкая производительность труда, отсутствие разнообразия данных и разрыв в обслуживании малых и средних команд - три основных болевые точки отрасли.