Тема 01

Тема 1. Что такое ИИ: история и классификация подходов

Искусственный интеллект занимает особое место среди дисциплин, связанных с информационными технологиями. В отличие от большинства инженерных направлений, ИИ с момента зарождения ставил перед собой не только практические, но и фундаментальные вопросы: может ли машина мыслить, каковы границы автоматизации интеллектуальной деятельности, чем формальное рассуждение отличается от понимания. Окончательных ответов нет до сих пор, однако попытки их найти породили методы, которые сегодня лежат в основе машинного обучения, компьютерного зрения, обработки естественного языка и многих других прикладных областей. В рамках этой темы мы проследим, как формировалась дисциплина, какие подходы в ней сложились и какое место среди них занимает машинное обучение — центральный предмет настоящего курса.

Становление искусственного интеллекта как научной дисциплины

Истоки и предпосылки

Идея создания искусственного разума значительно старше самих вычислительных машин. Ещё в XVII веке Лейбниц предложил концепцию универсального исчисления (лат. calculus ratiocinator) — формальной системы, способной механически порождать истинные утверждения ¹. До появления программируемых вычислительных устройств подобные идеи оставались философскими конструкциями, но они задали направление мысли: интеллект можно попытаться свести к вычислению.

Поворотной точкой стала работа Алана Тьюринга «Computing Machinery and Intelligence» ². Предложенный в ней тест формулируется просто: если человек, общаясь с собеседником через текстовый интерфейс, не может надёжно определить, является ли тот человеком или машиной, то машину следует признать обладающей интеллектом. Тест Тьюринга не является строгим научным критерием — он не определяет, что именно означает «мыслить». Его заслуга в другом: проблема была переведена из философской плоскости в операциональную и стала предметом инженерного исследования.

Параллельно развивалась математическая логика. Работы Гёделя, Чёрча и самого Тьюринга показали, что существуют чётко определённые границы вычислимости: не всякая математическая задача может быть решена алгоритмически. Эти результаты обозначили пределы того, на что в принципе способна вычислительная машина, но одновременно дали ИИ строгий язык для постановки задач.

Ещё одна предпосылка — кибернетика Норберта Винера ³. Винер показал, что процессы управления у живых организмов и в технических системах подчиняются общим закономерностям: и те и другие используют обратную связь для корректировки поведения. Этот взгляд — интеллектуальное поведение как результат взаимодействия системы со средой — впоследствии нашёл развитие в обучении с подкреплением.

Основные этапы развития

Формальной датой рождения ИИ как самостоятельной дисциплины принято считать 1956 год — Дартмутский семинар, организованный Джоном Маккарти, Марвином Минским, Натаниэлем Рочестером и Клодом Шенноном. Именно в заявке на его проведение впервые появился термин artificial intelligence ⁴. Участники исходили из оптимистичного предположения, что за одно лето удастся существенно продвинуться в моделировании мышления. Оптимизм оказался преждевременным, но направление было задано.

Первые два десятилетия после семинара прошли под знаком символьного подхода. Исследователи создавали программы, оперирующие символами и правилами: Logic Theorist Ньюэлла и Саймона ⁵ доказывала математические теоремы, другие системы планировали действия и играли в шахматы. Результаты впечатляли — машины справлялись с задачами, которые считались интеллектуальными. Проблема обнаружилась при попытке выйти за пределы хорошо формализованных областей: стоило задаче столкнуться с неструктурированной реальностью, система оказывалась беспомощной.

Разрыв между обещаниями и реальностью привёл к первой «зиме ИИ» (середина 1970-х). Отчёт Лайтхилла ⁶ в Великобритании и аналогичные оценки в США констатировали провал: комбинаторный взрыв при масштабировании задач, неспособность работать с неточной информацией, отсутствие обучения на опыте — всё это оказалось значительно сложнее, чем предполагалось. Финансирование было резко сокращено.

Новую волну интереса в 1980-х вызвали экспертные системы — программы, воспроизводящие рассуждения специалиста в конкретной предметной области. MYCIN диагностировала инфекционные заболевания ⁷, XCON конфигурировала вычислительные системы ⁸. Коммерческая ценность была продемонстрирована, но обнаружилось узкое место: базы знаний приходилось формировать вручную, что делало системы дорогими в создании и неустойчивыми к изменениям предметной области.

Именно разочарование в ручном формировании знаний стало одной из причин статистического поворота 1990–2000-х — смены научной парадигмы, при которой исследователи перестали пытаться описать интеллект через явные логические правила и перешли к его моделированию средствами математической статистики и теории вероятностей. Знание в такой постановке — не набор предписанных экспертом утверждений, а закономерность, оценённая по выборке наблюдений; рассуждение — не дедуктивный вывод, а оценка вероятности гипотезы при имеющихся данных. К этому методологическому сдвигу добавились два внешних фактора — рост объёмов доступных данных и удешевление вычислений. Вместо попыток явно запрограммировать интеллектуальное поведение исследователи стали строить модели, обучающиеся на данных: деревья решений, метод опорных векторов, байесовские классификаторы.

Наконец, прорыв 2012 года: свёрточная нейронная сеть AlexNet ⁹ выигрывает конкурс ImageNet с радикальным отрывом от конкурентов. С этого момента глубокие нейронные сети стали доминирующим инструментом в компьютерном зрении, обработке естественного языка, распознавании речи. Три фактора сделали это возможным: большие размеченные датасеты, вычислительная мощность GPU и усовершенствованные алгоритмы обучения (dropout, batch normalization, улучшенные функции активации).

Десятилетие после AlexNet принесло ещё один сдвиг — на этот раз в обработке естественного языка. В 2017 году была предложена архитектура трансформера ¹⁰, основанная на механизме внимания и допускающая параллельное обучение на огромных корпусах текста. На её основе выросло семейство больших предобученных моделей, дообучаемых под частные задачи: BERT — для понимания текста, GPT-серия — для генерации, CLIP — для согласования текста и изображений. Качественный скачок произошёл в 2022–2023 годах: появление ChatGPT, диффузионных моделей синтеза изображений (Stable Diffusion, Midjourney), мультимодальных систем, способных одновременно работать с текстом, изображением и звуком. К 2024–2025 годам в фокус вышли ИИ-агенты — модели, не только отвечающие на вопрос, но и самостоятельно планирующие последовательность действий, обращающиеся к внешним инструментам и API. Технологически это всё то же глубокое обучение, выросшее из коннекционистских идей середины XX века, — но масштаб моделей и широта решаемых задач изменили общественное восприятие ИИ радикальнее, чем любой прежний этап.

Классификация подходов к ИИ

Символьный ИИ и коннекционизм

Всю историю ИИ пронизывает противостояние двух подходов к моделированию интеллекта.

Символьный подход (англ. symbolic AI, иногда GOFAI — Good Old-Fashioned AI ¹¹) исходит из того, что интеллектуальная деятельность сводится к манипулированию символами по формальным правилам. Знания представляются явно — факты, правила, онтологии — а рассуждение реализуется как логический вывод. Чтобы понять, как это работает на практике, достаточно вспомнить экспертную систему MYCIN: она хранила несколько сотен правил вида «если у пациента наблюдается симптом X и результат анализа Y, то с вероятностью Z причина — инфекция W». Система была способна обосновать каждый шаг рассуждения — и в этом главное достоинство символьного подхода. Его главное ограничение — там, где знания трудно формализовать (распознавание образов, понимание естественного языка), символьные системы работают плохо.

Коннекционистский подход (англ. connectionism) устроен принципиально иначе. Вместо явного задания правил система обучается на примерах, самостоятельно выявляя закономерности. Перцептрон Розенблатта ¹², многослойные сети с обратным распространением ошибки ¹³ — ранние модели демонстрировали способность к обобщению, но упирались в нехватку данных и вычислительных ресурсов. Современные глубокие нейронные сети — по сути, развитие того же коннекционистского подхода, получившего практическую применимость благодаря аппаратному и алгоритмическому прогрессу.

Современные нейро-символьные системы разделяют задачу между подходами: нейронная сеть распознаёт объекты на изображении или извлекает сущности из текста, а затем передаёт результат символьному модулю, который выполняет логический вывод, проверяет ограничения или строит план действий. Например, в системе визуального ответа на вопросы (англ. visual question answering) нейросеть определяет, какие объекты присутствуют на изображении, а логический модуль отвечает на вопрос «сколько красных предметов левее куба?», оперируя уже структурированными фактами ¹⁴. Тем не менее для осознанного выбора методов и понимания их ограничений различение символьного и коннекционистского подходов остаётся принципиально важным. В настоящем курсе мы работаем преимущественно в коннекционистской и статистической парадигмах, но в теме 2 рассмотрим и классические методы поиска, восходящие к символьной традиции.

Иерархия понятий: ИИ, машинное обучение, глубокое обучение

Термины искусственный интеллект, машинное обучение, глубокое обучение и наука о данных в популярных источниках часто используются как синонимы — это создаёт устойчивую путаницу. Между ними есть строгая вложенность.

Искусственный интеллект — самое широкое из перечисленных понятий: дисциплина, охватывающая любые методы автоматизации интеллектуальной деятельности, включая символьные системы, эвристический поиск, экспертные системы и обучающиеся модели. Машинное обучение (англ. machine learning, ML) — подраздел ИИ, в котором поведение системы определяется не правилами, написанными человеком, а параметрами, подобранными по данным. Глубокое обучение (англ. deep learning, DL) — частный случай машинного обучения, использующий многослойные нейронные сети с большим числом параметров; именно благодаря ему произошли прорывы 2010-х в задачах восприятия и языка.

Наука о данных (англ. data science) расположена иначе — это пересекающаяся, а не вложенная область. Она включает сбор, очистку, разведочный анализ, визуализацию данных и статистический вывод; машинное обучение для неё — лишь один из инструментов, а не центральный предмет. Инженер ML опирается на навыки data scientist на этапе подготовки данных, но дальше работает с алгоритмами обучения и метриками качества модели.

Практическое следствие простое: говоря «применим ИИ», уточняйте — символьное правило, классическая ML-модель или глубокая сеть. Каждый уровень предъявляет разные требования к данным, вычислительным ресурсам, интерпретируемости и квалификации команды.

Парадигмы машинного обучения

Внутри машинного обучения принято выделять три парадигмы, различающиеся не алгоритмами, а характером обратной связи, по которой модель учится.

Обучение с учителем (англ. supervised learning) — самая распространённая постановка: модель получает обучающую выборку из пар «вход → правильный ответ» и подбирает параметры так, чтобы её предсказания на этих парах согласовывались с эталоном. Сюда относятся классификация (предсказать метку класса) и регрессия (предсказать число). Ограничение метода — необходимость размеченных данных, разметка которых, как правило, трудоёмка и дорога. Темы 3–6 настоящего курса посвящены именно этой парадигме.

Обучение без учителя (англ. unsupervised learning) работает с неразмеченной выборкой и ищет в ней скрытую структуру: кластеризация (группировка похожих объектов), снижение размерности, обнаружение аномалий. Здесь не существует «правильного ответа», поэтому оценка качества опирается на косвенные метрики и интерпретацию полученной структуры экспертом.

Обучение с подкреплением (англ. reinforcement learning, RL) описывает агента, взаимодействующего со средой: он совершает действия, получает в ответ числовое вознаграждение и со временем подбирает стратегию (англ. policy), максимизирующую суммарное вознаграждение. Парадигма применима там, где правильный ответ заранее неизвестен, но известен критерий успеха: игры, робототехника, оптимизация рекламы, управление сетевой инфраструктурой. Идейно RL восходит к кибернетике Винера с её обратной связью, упомянутой выше.

В реальных системах парадигмы редко используются в чистом виде. Самообучение (англ. self-supervised learning) формирует учительский сигнал из самих данных — на этом подходе обучены большие языковые модели. Полу-учитель (англ. semi-supervised learning) комбинирует малую размеченную выборку с большой неразмеченной. Понимание базовых трёх парадигм даёт каркас, на который такие гибриды естественно укладываются.

Сильный и слабый ИИ

Другая фундаментальная классификация касается не методов, а целей и претензий ИИ-систем.

Слабый (узкий) ИИ (англ. narrow AI, weak AI) — система, спроектированная для решения конкретной задачи или класса задач. Шахматная программа, система распознавания лиц, голосовой ассистент, рекомендательный алгоритм — всё это слабый ИИ. Такая система может превосходить человека в своей области, но не обладает общим пониманием мира, не переносит знания между доменами без специальной адаптации, не имеет самосознания.

Сильный (общий) ИИ (англ. artificial general intelligence, AGI) — гипотетическая система с когнитивными способностями на уровне человека: обучение в произвольных областях, рассуждение, планирование, адаптация к новым ситуациям.

Разграничение сильного и слабого ИИ восходит к работе Джона Сёрла ¹⁵, предложившего мысленный эксперимент «Китайская комната». Суть эксперимента: человек, не знающий китайского языка, сидит в закрытой комнате и получает записки с иероглифами. У него есть подробная инструкция на английском, которая для каждой комбинации входных символов предписывает, какие символы написать в ответ. Следуя инструкции, он выдаёт ответы, неотличимые от ответов носителя языка, — но при этом не понимает ни слова по-китайски. Сёрл утверждал, что компьютерная программа находится в том же положении: она манипулирует символами по правилам, однако не обладает пониманием их смысла. Аргумент остаётся дискуссионным, но он наглядно показывает, почему корректное выполнение задачи не тождественно пониманию. Ни одна существующая система определению сильного ИИ не соответствует.

Мысленный эксперимент Джона Сёрла «Китайская комната»

Для нас это разграничение имеет практическое значение. Все методы настоящего курса относятся к слабому ИИ: каждый решает определённый тип задач, требует соответствующей подготовки данных, выбора архитектуры и настройки гиперпараметров. Представление о том, что современные нейронные сети «понимают» данные в человеческом смысле слова, — распространённое заблуждение, которое ведёт к некорректному применению методов и завышенным ожиданиям от результатов.

Ландшафт методов и задач ИИ

Для дальнейшего изложения выделим четыре крупных класса задач ИИ.

Классификация задач искусственного интеллекта

Задачи восприятия — извлечение структурированной информации из неструктурированных входных данных: распознавание объектов на изображениях, детекция лиц, сегментация сцен, преобразование речи в текст, анализ сенсорных данных. Эти задачи долгое время считались одними из самых трудных, поскольку требуют обобщения на уровне, естественном для человека, но плохо поддающемся формализации. Прорыв произошёл именно в задачах восприятия — с появлением свёрточных нейронных сетей, о которых пойдёт речь в теме 7.

Задачи рассуждения охватывают логический вывод, планирование действий, принятие решений в условиях ограничений: доказательство теорем, планирование маршрутов, составление расписаний, конфигурирование сложных систем. Исторически это территория символьного ИИ, и для ряда таких задач символьные методы по-прежнему наиболее эффективны. Подробнее — в теме 2.

Ядро настоящего курса составляют задачи обучения: классификация (отнесение объекта к одному из заранее определённых классов), регрессия (предсказание непрерывной величины), кластеризация (группировка объектов по сходству без заданных меток). Именно им посвящены темы 3–7, и именно на них мы будем отрабатывать полный цикл — от подготовки данных до оценки качества модели.

Задачи генерации связаны с созданием нового контента: текстов, изображений, музыки, программного кода. От простых марковских цепей до больших языковых моделей (англ. large language model, LLM) и диффузионных моделей — это одно из наиболее активно развивающихся направлений. Основы генеративных подходов рассматриваются в заключительной теме курса.

Границы между классами условны. Беспилотный автомобиль одновременно решает задачи восприятия (камеры, лидар), рассуждения (планирование маршрута) и обучения (адаптация к дорожным условиям). Но как рабочая классификация для структурирования учебного материала это деление достаточно.

Литература

Russell S., Norvig P. Artificial Intelligence: A Modern Approach. — Pearson, 2021.
Turing A. M. Computing Machinery and Intelligence. — Mind, 1950, С. 433–460, DOI: 10.1093/mind/LIX.236.433.
Wiener N. Cybernetics: Or Control and Communication in the Animal and the Machine. — MIT Press, 1948.
McCarthy J., Minsky M. L., Rochester N., Shannon C. E. A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence, August 31, 1955. — AI Magazine, 2006, С. 12–14, DOI: 10.1609/aimag.v27i4.1904.
Newell A., Simon H. A. The Logic Theory Machine: A Complex Information Processing System. — IRE Transactions on Information Theory, 1956, С. 61–79, DOI: 10.1109/TIT.1956.1056797.
Lighthill J. Artificial Intelligence: A General Survey. — 1973.
Shortliffe E. H. Computer-Based Medical Consultations: MYCIN. — Elsevier, 1976.
McDermott J. R1: A Rule-Based Configurer of Computer Systems. — Artificial Intelligence, 1982, С. 39–88, DOI: 10.1016/0004-3702(82)90021-2.
Krizhevsky A., Sutskever I., Hinton G. E. ImageNet Classification with Deep Convolutional Neural Networks. — Advances in Neural Information Processing Systems (NeurIPS), 2012, С. 1097–1105.
Vaswani A., Shazeer N., Parmar N., Uszkoreit J., Jones L., Gomez A. N., Kaiser {., Polosukhin I. Attention Is All You Need. — Advances in Neural Information Processing Systems (NeurIPS), 2017, С. 5998–6008.
Haugeland J. Artificial Intelligence: The Very Idea. — MIT Press, 1985.
Rosenblatt F. The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain. — Psychological Review, 1958, С. 386–408, DOI: 10.1037/h0042519.
Rumelhart D. E., Hinton G. E., Williams R. J. Learning Representations by Back-Propagating Errors. — Nature, 1986, С. 533–536, DOI: 10.1038/323533a0.
Yi K., Wu J., Gan C., Torralba A., Kohli P., Tenenbaum J. B. Neural-Symbolic VQA: Disentangling Reasoning from Vision and Language Understanding. — Advances in Neural Information Processing Systems (NeurIPS), 2018.
Searle J. R. Minds, Brains, and Programs. — Behavioral and Brain Sciences, 1980, С. 417–424, DOI: 10.1017/S0140525X00005756.

Дополнительные материалы темы 1

Становление искусственного интеллекта как научной дисциплины

What They Did That Summer in Dartmouth — IEEE Spectrum — большая статья с развёрнутым историческим контекстом: предыстория предложения семинара, реальные результаты лета 1956 года и расхождение между ожиданиями организаторов и достигнутым.
AlexNet — Wikipedia — разбор архитектуры сети, победившей ImageNet в 2012 году: восемь слоёв (пять свёрточных и три полносвязных), использование ReLU вместо tanh, dropout как регуляризация, обучение на двух GPU с разделением каналов между ними. Показано, чем именно AlexNet отличался от предшественников и почему именно он стал точкой отсчёта эпохи глубокого обучения.
The Bitter Lesson — Rich Sutton (2019) — короткое эссе одного из создателей обучения с подкреплением о ключевом уроке семидесятилетней истории ИИ: методы, опирающиеся на масштабирование вычислений, в долгосрочной перспективе обыгрывают методы, опирающиеся на встроенное человеком знание. Полезно как концептуальная рамка для понимания траектории «символьный → статистический → глубокий» этап.

Классификация подходов к ИИ

В чём различия между Data Science, машинным обучением, ИИ, глубоким обучением и Data Mining — Habr (перевод) — обзорная русскоязычная статья, проходящая по всем пяти терминам с разбором их пересечений и различий. Полезна как параллельное чтение к разделу «Иерархия понятий: ИИ, машинное обучение, глубокое обучение» — даёт ту же картину под другим углом и с дополнительными примерами из области data mining.
The Chinese Room Argument — Stanford Encyclopedia of Philosophy — каноническая философская статья с подробным разбором аргумента Сёрла, основных возражений (системный ответ, ответ робота, ответ симулятора мозга) и современных интерпретаций в свете больших языковых моделей. Уровень подачи академический, но без формализма.
Учебник по машинному обучению — ШАД, Яндекс — открытый русскоязычный учебник Школы анализа данных, охватывающий supervised/unsupervised обучение, деревья решений, градиентный бустинг, нейронные сети. Хорош как параллельное чтение к темам 3–8 настоящего курса с альтернативной подачей и упражнениями.
Reinforcement Learning: An Introduction — Sutton, Barto, 2nd ed. — каноническое введение в обучение с подкреплением, доступное в открытом PDF. Для тех, кто хочет глубже разобраться с третьей парадигмой ML, упомянутой в теме лишь обзорно.

Ландшафт методов и задач ИИ

Papers With Code — каталог ML-задач с привязкой к статьям, датасетам и текущим бенчмаркам. Удобный навигатор по «состоянию дел» в любой подзадаче — от детекции объектов до распознавания речи и генерации кода.
Neural Networks — 3Blue1Brown — видеосерия с визуальным разбором того, как работает многослойная сеть, обратное распространение ошибки и градиентный спуск. Полезно перед погружением в тему 8.

Окружение лабораторной работыzip

Лабораторная работа 1. Знакомство с ландшафтом ИИ-инструментов

Объём: 4 академических часа
Раздел курса: учебное пособие, тема 1 «Что такое ИИ: история и классификация подходов»

Введение

Тема 1 описывает историю и классификацию подходов к ИИ умозрительно — через тексты, диаграммы и примеры. Цель этой работы — закрепить классификацию в практическом опыте: студент собирает рабочее окружение, знакомится со стеком библиотек, который будет использоваться весь оставшийся курс, и пробует на нём три разные по парадигме ИИ-системы. По итогам он должен уметь не только воспроизвести классификацию из лекции, но и поместить в неё произвольную систему, с которой столкнётся на практике.

Работа открывает практикум: подготовленное здесь окружение и навыки запуска ноутбуков будут использоваться во всех последующих лабораторных без переустановки.

Цель работы

Развернуть рабочее ML-окружение и провести классификацию реальных ИИ-систем по основным дихотомиям, введённым в теме 1.

После выполнения работы студент сможет:

развернуть окружение Python 3.10+ с менеджером виртуальных сред и основными библиотеками (numpy, scikit-learn, transformers) и убедиться в его работоспособности через тестовый ноутбук;
запустить три демонстрационные системы — правило-ориентированную, статистическую и нейросетевую — и зафиксировать их результаты;
отнести каждую систему к точной позиции в классификациях темы 1 (символьный/коннекционистский, узкий/общий, тип задачи) с обоснованием;
классифицировать произвольную ИИ-систему по тем же осям на материале трёх внешних продуктов по своему выбору.

Теоретический минимум

Концептуальная база — учебное пособие, тема 1: разделы «Символьный ИИ и коннекционизм», «Иерархия понятий: ИИ, машинное обучение, глубокое обучение», «Парадигмы машинного обучения», «Сильный и слабый ИИ», «Классификация задач».

Технически работа опирается на стандартный Python-стек анализа данных, знакомый по курсу ВвАД. Дополнительно используется библиотека transformers от Hugging Face — Python-обёртка над предобученными нейросетевыми моделями (BERT, GPT-2 и др.), позволяющая загрузить готовую модель и получить от неё инференс одной строкой через объект pipeline. Регистрация на huggingface.co для базовых моделей не требуется; ограничение по размеру скачиваемых весов — порядка 500 МБ на модель.

Перечень оснащения

Python 3.10 или новее; рекомендуется менеджер виртуальных окружений (venv, conda, uv — на выбор).
Jupyter Notebook или Jupyter-совместимая среда (VS Code с расширением, JupyterLab, Google Colab).
Библиотеки: numpy, pandas, scikit-learn, matplotlib, transformers, torch (CPU-сборка достаточна).
Свободное дисковое пространство — не менее 3 ГБ (модели Hugging Face кэшируются локально).
Доступ в интернет для первичной установки пакетов и скачивания моделей.

Заготовки кода и тестовый ноутбук — в каталоге lr-env/ рядом с этим файлом.

Порядок выполнения работы

Часть 1. Подготовка окружения

Задание

Создать виртуальное окружение и установить пакеты из lr-env/requirements.txt.
Запустить ноутбук lr-env/00_smoke_test.ipynb и убедиться, что все ячейки выполняются без ошибок: проверяются версии пакетов, импорт sklearn и transformers, доступность CPU-устройства для PyTorch.
Зафиксировать в отчёте: используемая ОС, версия Python, способ управления окружением, итоговый список установленных пакетов (вывод pip freeze).

Результат

Работающее окружение и подтверждение его готовности — все ячейки smoke-test ноутбука выполнены без исключений, скриншот вывода приложен к отчёту.

Часть 2. Три демонстрационные системы

Задание

Запустить три заготовленных ноутбука и зафиксировать их выводы.

Правило-ориентированная система — lr-env/01_rule_based.ipynb. Простой классификатор грибов (съедобный / ядовитый) на правилах, заданных вручную поверх 4–5 признаков. Прогнать на тестовой выборке, зафиксировать точность.
Статистическая ML-модель — lr-env/02_sklearn_iris.ipynb. Классификация ирисов Фишера через логистическую регрессию из scikit-learn. Обучить, замерить точность на отложенной выборке, посмотреть весовые коэффициенты модели.
Нейросетевая модель — lr-env/03_hf_sentiment.ipynb. Анализ тональности коротких текстов через transformers.pipeline("sentiment-analysis") (модель загрузится с Hugging Face Hub при первом запуске). Прогнать на 5 предложенных предложениях и на 3 своих собственных.

В каждом случае зафиксировать: что подавалось на вход, что получилось на выходе, метрику качества там, где её можно посчитать.

Заполнить сравнительную таблицу для трёх систем из части 2 по осям:
- подход (символьный / коннекционистский / гибридный);
- тип задачи (восприятие / рассуждение / обучение / генерация);
- класс ИИ (узкий / общий);
- источник «знаний» системы (правила, обученные параметры, и то и другое);
- сильные и слабые стороны на материале вашего эксперимента.
Выбрать три внешние ИИ-системы, с которыми вы регулярно сталкиваетесь (примеры: ChatGPT, рекомендации YouTube, разблокировка телефона по лицу, голосовой ассистент, автокоррекция клавиатуры, шахматный движок). Заполнить для них ту же таблицу. По каждой кратко обосновать классификацию: какие наблюдаемые признаки системы позволяют отнести её к указанной позиции.
Сформулировать выводы: где классификация однозначна, где условна, какие случаи оказались гибридными.

Результат

Две заполненные таблицы и текст с выводами (5–10 предложений) в отчёте.

Форма отчёта

Отчёт оформляется в Markdown и содержит:

титульный блок (фамилия, группа, дата, тема работы);
по части 1 — описание окружения и скриншот успешного smoke-test;
по части 2 — для каждой из трёх систем: ссылка на ноутбук в репозитории, скриншот ключевого результата, краткое описание (3–5 строк);
по части 3 — две сравнительные таблицы и текст выводов;
приложение — три проработанных ноутбука (01_rule_based.ipynb, 02_sklearn_iris.ipynb, 03_hf_sentiment.ipynb) с сохранёнными выводами ячеек.

Технические правила сдачи (структура веток, Merge Request, валидатор) — см. правила выполнения работ практикума.

Контрольные вопросы

Чем правило-ориентированная система отличается от модели, обученной на данных, на уровне источника знания и способа их обновления?
Почему классификатор ирисов из scikit-learn относится к узкому ИИ, а не к общему?
К какой парадигме машинного обучения (с учителем, без учителя, с подкреплением) относится каждая из трёх демонстрационных систем? Обоснуйте.
В каком смысле модель pipeline("sentiment-analysis") из transformers является «глубоким обучением», а логистическая регрессия — нет?
Приведите пример системы, которую корректно отнести одновременно к нескольким типам задач. Какие из её компонентов решают какие задачи?
Как изменилось бы поведение правило-ориентированного классификатора грибов, если бы в обучающую выборку попал гриб с признаками, не предусмотренными правилами? Как ведёт себя в этой же ситуации статистическая модель?
На примере одной из выбранных вами внешних систем покажите, в каком смысле её «понимание» предметной области принципиально отличается от человеческого. Связано ли это с аргументом «Китайской комнаты» Сёрла?