13.12.2024 11:45 23
Сбер выложил в открытый доступ свои AI-технологии
На международной конференции AI Journey («Путешествие в мир искусственного интеллекта») технический директор GigaChat Федор Минькин представил новые версии моделей машинного обучения.
Среди них — базовая и инструктивная версии GigaChat Lite, самая быстрая модель, а также GigaEmbeddings-instruct, самая сильная модель на русском языке согласно бенчмарку ruMTEB. Кроме того, семейство open-source моделей для распознавания речи и эмоций GigaAM получило значительное обновление.
Улучшения в новой версии акустических моделей GigaAM касаются как подготовки данных, так и технологии предобучения базовой модели. Например, для самой мощной модели GigaAM-RNNT улучшен показатель на 25 процентов по сравнению с предыдущей версией, и на 56 процентов превосходит модель OpenAI-Whisper-large-v3. Эти изменения делают модели GigaAM еще более эффективными и точными в распознавании речи и эмоций.Эксперт: Новые модели GigaAM, обновленные командой разработчиков, теперь поддерживают дообучение и инференс с Flash Attention, что значительно ускоряет процессы на современных видеокартах. Кроме того, переход на другое позиционное кодирование способствует улучшению производительности. Для удобства использования моделей был упрощен код, снижено число зависимостей, и подготовлена конвертация в формат ONNX. Эти новые модели доступны с лицензией MIT, что открывает возможности для их коммерческого использования.Разработчикам и предпринимателям теперь доступны базовая и инструктивная версии GigaChat Lite в open-source. Это предоставляет дополнительные возможности для создания и интеграции чат-ботов в различные проекты. Поддержка GigaChat Lite в open-source дает возможность расширить функциональность и использование чат-ботов в различных сферах бизнеса и разработки.Существует модель, которая выделяется своей мощностью в своей категории и успешно справляется с типовыми задачами, где требуется высокая скорость выполнения. Это архитектура Lite 20B MoE (Mixture-of-Experts) с 3.3B активных параметров, и несмотря на это она обладает качеством работы, соответствующим более мощным моделям.Кроме того, в open-source доступна еще одна модель - GigaEmbeddings-instruct, которая преобразует текст в числовое представление (вектор), эффективно кодируя всю информацию из запроса. Она идеально подходит для решения задач с применением технологии RAG (Retrieval Augmented Generation). По данным бенчмарка ruMTEB, GigaEmbeddings-instruct является лучшей в своем классе.Важно отметить, что использование современных моделей, таких как Lite 20B MoE и GigaEmbeddings-instruct, позволяет значительно улучшить эффективность и точность решения различных задач обработки текста и информации. Каждая из этих моделей представляет собой значимый шаг вперед в развитии искусственного интеллекта и обработки естественного языка.В современном мире использование больших языковых моделей становится все более популярным среди компаний, и одним из лидеров в этой области является GigaChat MAX. Эта мощная модель, а также другие языковые решения, предоставляются бизнесам через облачный API, что обеспечивает удобство и доступность при интеграции в различные процессы и приложения. Благодаря использованию облачного API, компании могут легко интегрировать языковые модели в свои продукты и сервисы, расширяя их функциональность и повышая качество обслуживания клиентов. Это открывает новые возможности для автоматизации процессов, улучшения аналитики и повышения эффективности бизнеса в целом.GigaChat MAX и другие языковые модели, доступные через облачный API, предлагают компаниям широкий спектр возможностей, начиная от автоматизации ответов на запросы клиентов до создания персонализированных рекомендаций на основе анализа текстовых данных. Это помогает бизнесам быть более конкурентоспособными и эффективными в современной цифровой среде.Источник и фото - lenta.ru