С развитием технологии искусственного интеллекта все больше разработчиков используют ее в своих проектах. По данным РБК, не менее 35% мировых компаний внедряют ИИ в свои продукты, а 73% планируют или уже используют чат-ботов для общения с клиентами
Обычно нейронные сети применяют для улучшения пользовательского пути
и расширения функциональности приложений. Программы, созданные
на основе ИИ, могут принимать голосовые команды и давать уникальные ответы,
не предусмотренные разработчиками, распознавать фотографии и жесты,
предлагать уникальные рекомендации и т.д.
В этой статье разберем, как осуществляется интеграция искусственного интеллекта
в разработку приложений, какие преимущества она дает, а также рассмотрим примеры готовых продуктов с ИИ.
Что такое искусственный интеллект и как он работает?
Перед тем как переходить к использованию ИИ в разработке, зафиксируем,что это такое и как работает. ИИ — это не одна технология, а общий термин, описывающий программные и аппаратные решения, поддерживающие:
- Машинное обучение.
- Глубокое обучение.
- Анализ больших данных.
- Компьютерное зрение.
- Обработку естественного языка и т.д.
Особенность ИИ — подход к анализу данных. Нейросети не работают по строго заданному алгоритму и могут работать с задачами, которые изначально не были заложены разработчиками. К примеру, ChatGPT способен не только общаться с человеком и искать информацию по теме, но и переписывать текст, выполнять анализ и т.д.
Искусственный разум обучается без постоянного участия разработчиков.
Он анализирует результаты взаимодействия с пользователем и автоматически настраивается таким образом, чтобы достичь максимальной точности.
Простой пример ИИ — шахматный компьютер. Интеграция искусственного
интеллекта в разработку приложений для любителей игры помогла сделать
сложного и непредсказуемого оппонента, глубоко анализирующего тактику человека. У модели ИИ нет четкого механизма действий, поэтому каждая партия уникальна.
Это только один вариант использования нейросетей в разработке программных продуктов. В действительности возможности применения безграничны. ИИ может решить многие задачи. Главное — правильно обучить его.
На что способен ИИ
Нейросети позволяют вывести разработку мобильных приложений
на новый уровень. На что способен компьютерный мозг:
- Персонализация
Искусственный разум анализирует поведение, вкусы, интересы пользователя
и предлагает персонализированные рекомендации. Это особенно важно, если говорить о платформах для e-commerce, поскольку 73% покупателей надеются, что бренды поймут их уникальные потребности и ожидания. К примеру, магазин собирает данные
о последних покупках, просмотренных товарных карточках и на их основе формирует уникальные рекомендации.
- Автоматизация задач
ИИ делает приложения более функциональными и удобными, поскольку способен обработать те запросы, которые раньше требовали ручного ввода. Реально автоматизировать выполнение таких задач как анализ фотографий, транскрибацию аудио и т.д.
- Повышение безопасности
Применение ИИ в антивирусах позволяет выявлять новые угрозы. К примеру,
Kaspersky Internet Security для Android имеет инструменты, которые способны самостоятельно выявить 33% вирусов, которых нет в базе данных. Результат — повышение безопасности для пользователя и снижение нагрузки на специалистов ИБ
- Оптимизация ресурсов смартфона или параметров ПО
Системы с такой функцией пригодятся тем, кто разрабатывает «тяжелые» программы (например, мобильные игры). ИИ в вашем приложении оптимизирует работу устройства или хотя бы настройки ПО, чтобы оно работало на слабых смартфонах.
Мы разобрали только часть возможностей ИИ, которые помогут разработать более удобное, персонализированное и функциональное приложение.
Как разработать ИИ для приложения
Процесс разработки и интеграции ИИ-систем в мобильные приложения
состоит из 5 основных этапов:
- Постановка задач
На подготовительном этапе разработчики определяют, для чего нужен искусственный интеллект. От этого зависит выбор модели ИИ, а вместе с ней — инструментов.
Так, для генерации изображений используют сверточные нейросети (Midjourney,
Stable Diffusion, Dream, DALL-E 2 и ruDALL-E), а рекуррентные — для прогнозирования временных рядов, обработки естественного языка. В одном проекте могут использоваться несколько алгоритмов для взаимодействия с пользователем.
Один принимает на входе команды и обрабатывает их, а другой — генерирует контент.
- Сбор и разметка данных
Чтобы подготовить нейросеть к работе, разработчики подготавливают выборку данных для обучения. Отметим, что ее качество напрямую влияет на будущие результаты ИИ. Кратко разберем, как делают разметку. Разработчик создает приложение для определения актеров в кадре. Для этого потребуются фотографии конкретного актера. Затем загружают сотни фото и кадров из фильма и к каждой картинке прописывают метаданные, т.е. информацию о свойствах объекта. - Выбор модели
С учетом задач и платформы, где будет запускаться ИИ (на сервере или на смартфоне) разработчики подбирают архитектуру и инструменты (TensorFlow, PyTorch, Keras и др.). Также на рынке есть готовые решения — TensorFlow Serving, TorchServe для распознавания аудио, видео, картинок на сервере. - Обучение
На этом этапе программисты загружают в базу все необходимые данные и начинают использовать ИИ. Они дают задачу «На фото есть лицо» и наводят камеру на какой-нибудь объект. ИИ отвечает «да» или «нет». Специалист оценивает ответ, а нейросеть сохраняет результат и настраивает нейроны так, чтобы более эффективно справляться с аналогичными задачами. Это обучение с постоянной поддержкой.
- Интеграция
Различные решения с использованием ИИ в приложениях работают на базе самого смартфона или стороннего сервера. Второй вариант предпочтительнее, поскольку разработчики не будут ограничены небольшими аппаратными возможностями клиентского устройства, а пользователи не столкнутся с зависаниями, долгими ответами, если смартфон слишком слабый. Простые нейросети можно интегрировать
в саму программу, но тогда для оптимизации софта стоит использовать прунинг
и квантизацию весов. Эти подходы позволяют ускорить работу ИИ и уменьшить
размер приложения и рабочих файлов.
После внедрения ИИ в продукт важно продолжить работу над ним. Нейросеть постоянно обучается в ходе взаимодействия с пользователем и становится лучше или хуже. Негативный пример: GPT-4 в 2023 году перестал определять простые числа. Его точность упала с 97,6% до 2,4%. Это произошло из-за «дрейфа» цепочки мыслей. ИИ просто перестал разбивать задачу на части и сразу выдавал «нет», хотя в марте 2023 нейросеть работала корректно.
Для избежания таких проблем рекомендуется постоянно собирать пользовательские оценки использования ИИ и вручную корректировать нейросети с помощью правильных обучающих выборок и изменения нарушенных алгоритмов.
Преимущества ИИ в мобильной разработке
Интеграция искусственного интеллекта в разработку приложений предлагает компаниям и рядовым пользователям длинный список выгод и преимуществ.
Основные из них:
- Улучшение UI
Приложения с ИИ делают взаимодействие с пользователем более индивидуальным и комфортным. Они предлагаются персонализированный контент, адаптивные интерфейсы, голосовых помощников и т.д.
- Глубокий анализ данных и принятие решений
ИИ способны работать с Big Data и помогать в принятии обоснованных решений.
К примеру, нейросети собирают информацию о том, как пользователи взаимодействуют с приложением, выявляют «шероховатости» и предлагают способы их решения.
- Поддержка без человека
Создание и интеграция чат-ботов позволяет автоматизировать техподдержку, предоставление рекомендаций и другие услуги. Современные чат-боты становятся интеллектуальнее и уже могут поддерживать осмысленную беседу, как реальный человек. Благодаря внедрению ИИ нагрузка на техподдержку станет ниже, а индекс удовлетворенности клиентов вырастет, поскольку пользователи получают ответы мгновенно. Отметим, что это крайне перспективное направление. Уже около 97% людей пользуются голосовыми помощниками с ИИ
- Локализация ПО
Команды, создающие продукты, для нескольких рынков сразу обычно привлекают переводчиков. С ChatGPT это можно сделать автоматически. Нейросеть знает 90 языков, так что вы без проблем выпустите продукт в США, Франции, России, Японии и еще 86 странах
Сложности интеграции ИИ
Сложное обучение
Искусственный интеллект — это сложная технология, у которой есть как минимум
5 препятствий, мешающих разработчикам. Чтобы выпустить качественный продукт, необходимо решить эти проблемы.
Хотя ИИ обучается самостоятельно, необходимо подготавливать массивы данных
(как размеченных, так и нет) и контролировать результаты обработки информации.
От их качества зависит этичность и точность нейросети
Учитывайте, что чат-боты учатся не только у разработчиков, но и у пользователей.
Помимо сложного обучения, есть проблема «отравленных» данных. Так называют заведомо некачественную информацию. Реальный пример: Microsoft создал чат-бота для Twitter, с которым можно побеседовать на любую тему. Уже через сутки пользователи научили ИИ материться, что недопустимо для коммерческого продукта.
Кроме того, важно устранить ложные корреляции. ИИ может рассматривать некоторые последовательности действий в качестве взаимосвязанных, хотя это не так.
Проблемы конфиденциальности
Для того, чтобы ИИ постоянно совершенствовался, разработчики внедряют функцию сохранения истории запросов («память»). Чат-бот сохраняет диалоги с пользователем
в базу и обращается к ним, если получает знакомый вопрос. Плюс такого подхода — больше данных из различных областей, а минус — риск для конфиденциальности.
В России компании, использующие компьютерный разум, рискуют нарушить 152-ФЗ, регулирующий хранение и использование персональных данных. Разработчики должны гарантировать, что приложение имеет надежную защиту данных,
а ИИ не разглашает личную информацию.
Один из вариантов решения проблемы — отказ от сохранения пользовательских данных. Тогда чат-бот будет обращаться только к информации от разработчиков
или к интернету.
В случае с рекомендательными сервисами и другими вариантами реализации необходимо сохранять данные, поэтому компании точно не смогут отказаться от ИСПДн. При разработке таких продуктов важно продумать политику конфиденциальности и потребовать от человека подписать ее, чтобы избежать различных проблем после публикации приложения в сторах.
Интеграции
Чтобы ИИ корректно взаимодействовал с другими компонентами приложения,
включая бэкенд, создайте надежные и быстрые API для передачи данных между различными системами. На рынке практически нет готовых решений для интеграции ИИ с другими сервисами и инструментами. Поэтому продуктовой команде придется создавать API с нуля и тестировать интерфейсы на наличие конфликтов, корректность работы в стрессовых условиях и т.д.
Стоимость
Нейросеть — дорогая технология. В 2024 году только крупный бизнес и IT-компании могут себе позволить инвестиции в ИИ. К примеру, ИИ для обработки естественного языка в среднем стоит 300–500 тыс. рублей, если отдать проект на аутсорс.
Если вы планируете самостоятельно заниматься созданием и интеграцией ИИ
в мобильные приложения, то сэкономить вряд ли получится. Можно найти
бесплатные инструменты для создания искусственного интеллекта (например, PyTorch), но для обучения и последующего функционирования нейросети точно
понадобятся инвестиции. Компании нужен сервер с GPU для обработки данных.
Заключение
Искусственный интеллект — перспективная технология, которая предлагает разработчикам мобильных приложений множество преимуществ. Внедрив ИИ, вы сделаете UI более персонализированным, внедрите поддержку голосовых команд, обработку аудио/видео/фото, сможете анализировать Big Data и т.д.
Главное — учитывайте недостатки нейросетей и устраняйте, поскольку в последнее время вопросы конфиденциальности, качества обучения ИИ становятся все острее.
Наша компания занимается разработкой ИТ-решений для сложных бизнес-процессов и имеет опыт внедрения технологий ИИ в разработку различных сервисов. Подробнее об услуге можно узнать здесь
Например, нами был создан бот-тренажёр для общения по теме личностных качеств руководителя. На основании полученных результатов можно сделать выводы об уровне компетенций опрашиваемого.