Недегенеративный ИИ

Поскольку искусственный интеллект сейчас в моде, люди часто думают, что искусственный интеллект сводится к одному лишь ChatGPT.

Но это не так.

Пейзаж искусственного интеллекта: больше, чем просто ChatGPT

ChatGPT, возможно, самое популярное в мире приложение для искусственного интеллекта, но оно ни в коем случае не является центром искусственного интеллекта. По сути, это интерфейс к Генеративному ИИ, который является лишь одним из 5 архетипов ИИ.

Помимо генеративного искусственного интеллекта, у нас есть контролируемое машинное обучение, компьютерное зрение, обработка естественного языка (NLP) и аудио/речь, которые мы можем использовать для решения различных бизнес-задач.

Но зачем все это?
А дело вот в чем: хотя генеративный ИИ — это новая блестящая игрушка, другие архетипы предлагают некоторые серьезные преимущества, такие как:

  • детерминированное поведение
  • интерпретируемость
  • полный контроль
  • владение ситуацией

Другими словами, изучив весь спектр ИИ, вы сможете найти подходящие инструменты для решения ваших конкретных проблем, оптимизации процессов и внедрения новых инноваций. Так что не ленитесь использовать ChatGPT, чтобы начать, но не позволяйте ему закрыть ваш потенциал в более широком ландшафте ИИ.

Целый мир искусственного интеллекта ждет своего открытия, и сегодня я более подробно рассмотрю некоторые примеры:

Контролируемое машинное обучение

По своей сути контролируемое машинное обучение заключается в изучении шаблонов на основе размеченных табличных данных.
Думайте об этом как об электронной таблице со стероидами.
Вы передаете в модель машинного обучения набор данных (например, информацию о клиентах, показатели продаж или показания датчиков) вместе с правильными ответами (например, ушел ли клиент, какой доход вы получили или машина вот-вот выйдет из строя).
Затем модель изучает закономерности и взаимосвязи в данных, что позволяет ей делать прогнозы на основе новых, ранее неизвестных данных.

Старое доброе контролируемое машинное обучение остается одним из наиболее важных приложений ИИ для бизнеса, потому что у него есть много отличных вариантов использования:

1. Прогнозирование временных рядов: прогнозируйте будущие продажи, спрос или рыночные тенденции на основе исторических данных.

2. Рекомендательные системы. Предлагайте пользователям продукты, контент или услуги на основе их предпочтений и поведения.

3. Механизмы классификации. Автоматически классифицируйте электронные письма, документы или изображения на основе их содержания.

Благодаря таким технологиям, как AutoML , контролируемое машинное обучение стало более доступным, чем когда-либо.
Все, что вам нужно, это иметь правильные данные и руку помощи на этом пути.

Компьютерное зрение

По своей сути компьютерное зрение работает аналогично контролируемому машинному обучению, но вместо таблиц оно занимается анализом изображений.
Единственное, что отличает изображения от таблиц, — это их сложность. Одно изображение может легко содержать миллионы точек данных, если учитывать пиксели и цвета. Именно здесь решения компьютерного зрения часто применяют технологии глубокого обучения, такие как нейронные сети. Звучит сложно? Ну это не так.

Но хорошая новость заключается в том, что вам не обязательно быть крупной технологической компанией, чтобы пожинать плоды использования. В компьютерном зрении существует множество предварительно обученных моделей для общих задач, которые вы можете легко настроить на собственных данных. Платформы без кода, такие как LandingAI или Azure Studio упрощают начало работы.

Некоторые классические примеры прикладного компьютерного зрения в бизнесе включают в себя:

1. Распознавание объектов: идентификация и нахождение определенных объектов, людей или текста на изображениях.

2. Извлечение значений. Автоматически извлекайте соответствующую информацию из изображений, например номерные знаки, этикетки продуктов или рукописные формы.

3. Удаление PII. Обнаружение и редактирование личной информации (PII) на изображениях, например лиц или конфиденциального текста.

Обработка естественного языка

Целью НЛП является обучение машин понимать, интерпретировать и генерировать человеческий текст. Все начинается с разбиения текста на его основные строительные блоки – слова, фразы и предложения. Отсюда модели НЛП используют различные методы для анализа структуры, значения и контекста текста.

Именно это позволяет компьютеру понять, например, что когда вы говорите: «Я предпочитаю Париж Льву», вы говорите о двух городах, и вы даже написали один из них неправильно.

Именно методы НЛП сделали возможным появление современного генеративного ИИ, такого как ChatGPT. Подобно компьютерному зрению, существует множество предварительно обученных языковых моделей (например, BERT), доступных для общих задач НЛП, которые можно настроить и адаптировать к вашему сценарию использования.

Несколько примеров того, что можно сделать с помощью «классического» НЛП, не трогая Генеративный ИИ:

1. Распознавание намерений. Понимайте основное намерение, лежащее в основе сообщения пользователя, будь то вопрос, запрос или команда.

2. Анализ настроений: определите эмоциональный тон или настроение фрагмента текста: положительный, отрицательный или нейтральный.

3. Фильтрация контента. Автоматически выявляйте и отфильтровывайте неуместный, оскорбительный или нерелевантный контент из текста.

Аудио/Речь

Обработка речи и звука позволяет машинам распознавать, интерпретировать и генерировать человеческую речь. Это похоже на НЛП, но применяется к аудиоданным, часто превращая звук в текст, чтобы затем использовать методы НЛП.

Что касается распознавания, аудио/речевой ИИ может транскрибировать произнесенные слова в письменный текст с поразительной точностью. Что касается синтеза, аудио/речевой ИИ может генерировать человеческую речь из письменного текста.

Для бизнеса это очень удобно в следующих сценариях:

1. Транскрипция звонков. Автоматически расшифровывайте звонки в службу поддержки клиентов, записи встреч или подкасты в текст с возможностью поиска и действия.

2. Живое повествование: создавайте аудиоописания или переводы в реальном времени для видео, презентаций или живых событий.

3. Шумоподавление: автоматическое определение и удаление фонового шума, эха и других искажений звука из записей.

Генеративный ИИ

Даже генеративный ИИ выходит за рамки ChatGPT и чистой генерации текста. Фактически, многие возможности других архетипов также могут быть достигнуты с помощью генеративного ИИ, поскольку большинство современных моделей генеративного ИИ являются мультимодальными, то есть они могут обрабатывать различные типы данных — например, текст, изображения или аудио.

Но имейте в виду, что общим знаменателем всех приложений на базе генеративного искусственного интеллекта является генерация оригинального контента.

Вот почему ЛЮБОЙ процесс GenAI по своей сути недетерминирован, а это означает, что при одних и тех же входных данных он может давать разные результаты. Галлюцинации — это не баг, а особенность.

И именно по этой причине многие другие архетипы ИИ все еще используются и будут использоваться – просто ими гораздо легче управлять. И очень часто они предлагают больше владения, потому что вы можете либо обучить модель самостоятельно, либо разместить ее полностью локально, что редко возможно с этими сверхбольшими моделями GenAI.

Примеры GenAI, которые не являются ChatGPT, включают:

1. Генерация видео : создание увлекательного контента, реалистичной анимации и визуальных эффектов.

2. Синтез речи : создает человеческую речь, улавливая нюансы и эмоции.

3. Апскейлинг изображения : повышает разрешение изображения за счет заполнения недостающих пикселей на основе изученных шаблонов.

Заключение

Дело в том, что ИИ — это обширная область, которая выходит далеко за рамки ChatGPT.

По мере нашего продвижения вперед вполне вероятно, что эти возможности ИИ станут более взаимосвязанными, что позволит сделать рабочие процессы еще более плавными и расширенными (например, чат-бот Teams на базе ИИ, который может делать автоматические прогнозы на основе ваших данных BI). В большинстве случаев ИИ будет работать скрытно; в других он будет более открытым и «видимым» для конечных пользователей.

В любом случае бизнес-пользователям придется адаптироваться и научиться задавать новые вопросы.

Такие вопросы, как: Насколько я уверен в этом прогнозе? Каковы потенциальные отклонения и ограничения этой модели? Как мы можем построить надежные, этичные и ответственные системы искусственного интеллекта?

Эти вопросы определят эффективное использование ИИ в ближайшие годы.