Машинное обучение и глубокое обучение: В чем разница?

Машинное обучение и глубокое обучение: В чем разница?

Дата публикации: 30.07.2024

Искусственный интеллект в наши дни повсюду, но разобраться в основах работы этой новой влиятельной технологии бывает непросто. Две наиболее важные области в развитии ИИ — это «машинное обучение» и его поднаправление «глубокое обучение», хотя иногда эти термины используются как взаимозаменяемые, что приводит к некоторой путанице. Вот краткое объяснение того, что представляют собой эти две важные дисциплины и как они способствуют развитию автоматизации.

Во-первых, что такое искусственный интеллект?

Сторонники искусственного интеллекта говорят, что надеются когда-нибудь создать машину, которая сможет «думать» сама за себя. Человеческий мозг — великолепный инструмент, способный производить вычисления, намного превосходящие возможности любой существующей машины. Однако инженеры-программисты, занимающиеся разработкой ИИ, надеются в конечном итоге создать машину, которая не только сможет делать все, что может делать человек, в интеллектуальном плане, но и превзойдет его. В настоящее время применение ИИ в бизнесе и правительстве в основном сводится к предсказательным алгоритмам, которые предлагают вам следующую песню на Spotify или пытаются продать вам товар, похожий на тот, что вы купили на Wildberries на прошлой неделе. Однако сторонники ИИ считают, что со временем технология сможет рассуждать и принимать гораздо более сложные решения. Именно в этом случае на помощь приходят ML и DL.

Машинное обучение

Машинное обучение (или ML) — это широкая категория искусственного интеллекта, которая обозначает процесс, в ходе которого программы «учатся» делать прогнозы или принимать «решения». Один из инженеров IBM, Джефф Крум, объясняет машинное обучение как очень сложную форму статистического анализа. По словам Крума, этот анализ позволяет машинам делать прогнозы или принимать решения на основе данных. Чем больше информации поступает в систему, тем больше она способна дать нам точных прогнозов.

В отличие от общего программирования, где машина создается для выполнения конкретной задачи, машинное обучение вращается вокруг обучения алгоритма, чтобы он сам выявлял закономерности в данных. Как уже говорилось, машинное обучение охватывает широкий спектр деятельности.

Глубокое обучение

Глубокое обучение — это и есть машинное обучение. Это одна из тех ранее упомянутых подкатегорий машинного обучения, которая, как и другие формы ML, фокусируется на обучении искусственного интеллекта «думать». В отличие от некоторых других форм машинного обучения, DL стремится позволить алгоритмам делать большую часть своей работы. В основе DL лежат математические модели, известные как искусственные нейронные сети (ANN). Эти сети стремятся имитировать процессы, которые естественным образом происходят в человеческом мозге — такие, как принятие решений и выявление закономерностей.

Ключевое различие между ML и DL

Одно из самых больших различий между глубоким обучением и другими формами машинного обучения заключается в уровне «надзора», который предоставляется машине. В менее сложных формах ML компьютер, скорее всего, занимается контролируемым обучением — процессом, в котором человек помогает машине распознавать закономерности в маркированных, структурированных данных и тем самым улучшает ее способность проводить прогнозный анализ.

Машинное обучение опирается на огромные объемы «обучающих данных». Такие данные часто собираются людьми путем маркировки данных. В ходе этого процесса создается обучающий набор данных, который затем можно передать алгоритму ИИ и научить его выявлять закономерности. Например, если компания обучает алгоритм распознаванию определенной марки автомобиля на фотографиях, она будет загружать в алгоритм огромные порции фотографий этой модели автомобиля, которые были вручную помечены людьми. Также создается «набор данных для тестирования», чтобы оценить точность предсказательных способностей машины после ее обучения.

Когда речь идет о DL, машина участвует в процессе, называемом «неконтролируемое обучение». Неконтролируемое обучение подразумевает использование машиной нейронной сети для выявления закономерностей в так называемых неструктурированных или «сырых» данных — данных, которые еще не были помечены или организованы в базу данных. Компании могут использовать автоматизированные алгоритмы для просеивания неорганизованных данных и тем самым избегать большого количества человеческого труда.

Как работают нейронные сети

Нейронные сети состоят из так называемых «узлов». По данным MIT, одна ANN может состоять из тысяч и даже миллионов узлов. Эти узлы могут быть немного сложными, но краткое объяснение заключается в том, что они, как и узлы в человеческом мозге, передают и обрабатывают информацию. В нейронной сети узлы расположены в организованной форме, которую называют «слоями». Так, сети глубокого обучения включают в себя несколько слоев узлов. Информация движется по сети и взаимодействует с различным окружением, что способствует принятию машиной решений при наличии человеческой подсказки.

Еще одним ключевым понятием в ИНС является «вес», который один из комментаторов сравнивает с синапсами в человеческом мозге. Веса, которые представляют собой просто числовые значения, распределяются по всей нейронной сети ИИ и помогают определить конечный результат работы системы ИИ. Веса — это информационные данные, которые помогают откалибровать нейронную сеть, чтобы она могла принимать решения. Глубокое погружение MIT в нейронные сети объясняет это следующим образом:

Каждому входящему соединению узел присваивает число, называемое «весом». Когда сеть активна, узел получает разные данные — разные числа — по каждому из своих соединений и умножает их на соответствующий вес. Затем он складывает полученные произведения вместе, получая единое число. Если это число меньше порогового значения, узел не передает никаких данных на следующий уровень. Если число превышает пороговое значение, узел «срабатывает», что в современных нейросетях обычно означает отправку числа — суммы взвешенных входов — по всем исходящим соединениям.

Короче говоря, нейронные сети построены таким образом, чтобы помочь алгоритму прийти к собственным выводам относительно данных, которые ему были поданы. Основываясь на своем программировании, алгоритм может выявлять полезные связи в больших массивах данных, помогая людям делать собственные выводы на основе их анализа.

Почему машинное обучение важно для развития ИИ?

Машинное и глубокое обучение помогает обучить машины выполнять прогностические и интерпретационные действия, которые раньше были уделом только человека. У этого есть много плюсов, но очевидный минус заключается в том, что эти машины могут неизбежно использоваться для вредных, а не просто полезных целей — таких, как правительственные и частные системы наблюдения, а также постоянная автоматизация военной и оборонной деятельности. Но они также, очевидно, полезны для потребительских предложений или кодирования, а в лучшем случае — для медицинских и оздоровительных исследований. Как и любой другой инструмент, то, насколько хорошо или плохо искусственный интеллект влияет на мир, во многом зависит от того, кто его использует.

Вам может быть интересно