Искусственный интеллект и нейросети. Теоретическая база.
12-04-2025, 13:41 2
Собирал теоретическую базу на начало 2025, решил опубликовать здесь.
Искусственный интеллект, согласно определению ГОСТ 15971-90, - способность вычислительной машины моделировать процесс мышления за счет выполнения функций, свойственных человеческому интеллекту. Такими функциями являются, например, обучение и логический вывод.
Искусственный интеллект (сокращенно ИИ) — это технология, которая использует алгоритмы для обработки больших объемов данных и нахождения в них закономерностей. На основе этих закономерностей ИИ может делать выводы, предсказывать события или принимать решения.
Одним из примеров ИИ являются искусственные интеллекты, построенные на базе нейронных сетей (сокращенно Нейросети) — базы данных с большим количеством формул, которые пытаются находить ответы на комплекс простых вопросов, чтобы ответить на сложный вопрос.
Нейронные сети, по определению Большой российской энциклопедии [1], - это искусственные многослойные высокопараллельные (т. е. с большим числом независимо параллельно работающих элементов) логические структуры, составленные из формальных нейронов.
Чем нейронная сеть отличается от обычного компьютерного алгоритма?
Классический компьютерный алгоритм — это инструкция, точное описание способа действия с использованием простых элементов [2] (например, операций). В статье «Обучение нейросети: алгоритмы и методы, типы» компании Training Data [3] доступно сформулирована разница между классическими компьютерными алгоритмами и работой нейросетей. Авторы приводят пример программы, которая рассчитывает площадь квартиры или дома по чертежу, имеет четкую пошаговую инструкцию, какие величины перемножать, какие складывать и т. д. У такого алгоритма понятная и простая архитектура: в него можно свободно вносить изменения на любом этапе.
У нейросетей другая логика работы. Им дают большой массив правильно решенных задач. После этого нейронной сети дают возможность самой решить подобную задачу. Она начинает угадывать, какой ответ от нее хотят получить. Отдельный алгоритм подсказывает ей, правильно ли она справилась с решением или нет. Со временем нейросеть учится угадывать все лучше и лучше, формирует связи внутри своей структуры, которые обеспечивают полезный результат. Развитие нейросетей — это итеративный процесс, метод проб и ошибок. [4]
Для успешного решения задач нейросети нуждаются в данных, признаках и алгоритмах. Данные — это любая информация, которая может помочь обучению. Например, статистика, исторические факты, примеры переводов с одного языка на другой, изображения. Эти данные накапливаются годами и объединяются в огромные массивы — датасеты. Они есть у всех крупных IT-компаний. Всем знаком способ сбора данных с помощью капчи: люди выбирают правильные изображения из представленных, а система запоминает корректные ответы и затем использует эти ответы как массив правильно решенных заданий.
Признаки — это то, на что должна обращать внимание нейросеть в процессе обучения. Например, к ним относится встречаемость слов в тексте, цена конкретных товаров. Чем более четко обозначены свойства и чем меньше их количество, тем сети проще обучаться. Однако для решения сложных задач современные нейронные модели вынуждены учитывать миллиарды признаков, которые определяют, как входные данные преобразуются в выходные.
Алгоритмы представляют собой способы решения задачи. Обычно для каждой задачи может быть использовано множество алгоритмов, поэтому очень важно выбрать наиболее точный и эффективный из них.
При всё при этом, необходимо сделать акцент на том, что ИИ совершает ошибки, но их совершают и люди. Попробуйте задать тот же вопрос, что задаёте нейросети (ИИ), ребёнку 3–4 лет, правильно ли он ответит? Искусственный интеллект, подобно естественному интеллекту, совершает ошибки и может на них учиться. Основы подобных утверждений разобрал Алан Тьюринг в 1950 году в основополагающей статье об искусственном интеллекте «Вычислительные машины и разум». [5]
В настоящее время существуют сотни крупных, мощных нейросетей и тысячи простых моделей. Люди все чаще ими пользуются, по данным компании Яндекс [6], с 2022 по 2024 годы интерес к нейросетям вырос в 15 раз. Нейросети учат на имеющемся в интернете материале, им показывают фотографии, видео, тексты, они учатся, словно люди, но проблема в том, что современные технологические возможности очень ограничены.
Самые мощные современные нейросети используют до 2 триллионов параметров. Каждый параметр можно уподобить нейтронным связям между нейронами в человеческом мозге, синапсам. По теоретическим расчетам [7] в каждом мозге более 100 триллионов синапсов (возможно, и больше). То есть, любой мозг человека в десятки раз мощнее самых мощных существующих (на начало 2025 года) нейросетей, которые, на данный момент, заходят в технологический тупик. Для работы ИИ требуется всё больше энергии и вычислительных возможностей. Согласно исследованию некоммерческого исследовательского института Epoch AI [8] в ближайшие два года центрам обработки данных ИИ может потребоваться почти вся мощность электроэнергии штата Калифорнии 2022 года (68 ГВт). К 2030 году обучение современной модели ИИ может потребовать выходной мощности, эквивалентной мощности восьми ядерных реакторов (8 ГВт), прогнозируется в отчете.
При этом, согласно данным информационно-консалтинговой компании Enerdata [9], общее потребление электроэнергии в 2021 во всем мире составило 19,6 ТВт. Согласно каталогу neirobox.ru/catalog/ [10] сейчас в мире действует 12633 нейросети, значительная часть из которых были запущена в предшествующий год. Их количество постоянно увеличивается. Самый приблизительный подсчет показывает, что в ближайшее время нейросети будут потреблять значительную долю электроэнергии на всей планете. Учитывая, что потребности человечества не ограничиваются нейросетями, все модели в ближайшее время столкнутся с нехваткой энергии на свою работу. Это классический пример когда уровень развития одной технологии (в данном случае — ИИ) напрямую связан с уровнем развития других технологий (энергетических).
Потребуется еще не одно десятилетие, чтобы нарастить технологические и энергетические возможности человечества, возможно, поможет решение прикладных проблем использования квантовых компьютеров. Но на данном этапе развития технологий ИИ в виде нейросетей способны на узкие прикладные задачи. Из-за энергетических и технологических ограничений они не заменят людей, учителей в том числе. Нужно научиться их использовать, использовать их возможности.
Нейросети — это мощный инструмент, который может быть использован для решения различных задач. Однако они все ещё находятся в стадии развития и имеют свои ограничения, в том числе в плане накопления физического опыта, а не информационного. Важно понимать, как они работают, и уметь использовать их возможности для достижения конкретных целей.
Несколько сервисов с открытым доступом, которые можно порекомендовать для прикладных задач:
1. Озвучивание текста и с редактированием параметров голоса . Работает на модели GPT-4o-mini-TTS : openai.fm
На данный момент уже действуют более 12633 нейросети и ai-инструментов и их количество постоянно увеличивается.
[1] Галушкин А. И. // Большая российская энциклопедия: [в 35 т.] / гл. ред. Ю. С. Осипов. — М. : Большая российская энциклопедия, 2004—2017.
[2] А. Л. Семенов // А — Анкетирование. — М. : Большая российская энциклопедия, 2005. — С. 426. — (Большая российская энциклопедия: [в 35 т.] / гл. ред. Ю. С. Осипов ; 2004—2017, т. 1
[3] Обучение нейросети: алгоритмы и методы, типы | Статья компании Training Data 17.08.2023 раздел "Методики"
[5] Turing A. «Computing Machinery and Intelligence» («Вычислительная техника и интеллект»), Mind : журнал. — Oxford: Oxford University Press, 1950. — No. 59. — P. 433—460
[6] Статистика знания и использования генеративных нейросетей https://ya.ru/ai/stat обращение 26.02.2025
[7] Паккенберг Б., Пелвиг Д., Марнер Л., Бундгаард М. Дж., Гундерсен Х. Дж. Г., Нюенгаард Дж. Р. и Регер Л. (2003). «Старение и неокортекс человека». Экспериментальная геронтология, 38(1-2), 95-99. doi:10.1016/S0531-5565(02)00151-1