Машинное обучение расширяет разрыв между знаниями и пониманием

Fallback Image

Программа «Глубокий пациент» не знает, что удар по голове может вызвать у нас головокружение, или что диабетикам не следует есть 5-килограммовые батончики Toblerone за один присест.

Он даже не знает, что кость руки связана с костью запястья. Все, что он знает, — это то, что исследователи скормили ему в 2015 году: медицинские записи 700 000 пациентов в виде беспорядочных данных, без скелета понимания, на котором можно было бы повесить все это.

Тем не менее, проанализировав взаимосвязь между этими слепыми частями, Deep Patient не только смог диагностировать вероятность того, что у отдельных пациентов разовьются конкретные заболевания, но в некоторых случаях он был более точным, чем врачи-люди, в том числе о некоторых заболеваниях, которые до сих пор совершенно не поддаются прогнозированию.

Глубокое обучение

Если вы спросите своего врача, почему Deep Patient считает целесообразным начать прием статинов или пройти профилактическую операцию, ваш врач может не сказать вам об этом, но не потому, что она недостаточно умна или техническа.

Глубокий пациент — это тип искусственного интеллекта, называемый глубоким обучением (сам по себе тип машинного обучения), который находит взаимосвязи между частями данных, ничего не зная о том, что эти данные представляют.

Исходя из этого, он собирает сеть информационных точек, каждая из которых имеет вес, определяющий, насколько вероятно, что точки, к которым она подключена, «сгорят», что, в свою очередь, влияет на точки, к которым они подключены, способ запуска нейрона в мозге.

Чтобы понять, почему Deep Patient думает, скажем, что существует 72% вероятности того, что у конкретного пациента разовьется шизофрения, врач должен был бы усвоить эти миллионы точек и каждое из их связей и весов.

Но их слишком много, и они находятся в слишком сложных отношениях.

Вы, как пациент, конечно, можете свободно отклонять вероятностные выводы Deep Patient, но вы рискуете, потому что в действительности мы используем диагностические системы «черного ящика», которые не могут объяснить их прогнозы, потому что в некоторых случаях они значительно более точны, чем человеческие врачи.

Это будущее, и не только для медицины. Навигационная система вашего телефона, прогнозы ввода текста, языковой перевод, музыкальные рекомендации и многое другое уже зависят от машинного обучения.

Поскольку эта форма вычислений становится более продвинутой, она может стать более загадочной. Например, если вы вычли количество возможных шахматных ходов из числа возможных ходов Го, остаток все еще во много раз превышает число атомов во вселенной.

Тем не менее, программа AlphaGo от Google, основанная на A.I., обычно побеждает самых популярных игроков, хотя она ничего не знает о Go, кроме того, что она узнала из анализа 60 миллионов ходов в 130 000 записанных играх.

Если вы исследуете внутренние состояния AlphaGo, чтобы попытаться выяснить, почему он совершил какое-то одно конкретное движение, вы, скорее всего, не увидите ничего, кроме неописуемо сложного набора взвешенных отношений между его данными.

AlphaGo может просто не сказать вам, что человек может понять, почему он сделал то, что сделал.

Тем не менее, о движении AlphaGo, в результате которого некоторые комментаторы потеряли дар речи, один из мастеров го, Фань Хуэй, сказал:

«Это не человеческое движение. Я никогда не видел, чтобы человек играл это движение». Затем тихо: «Так красиво. Красивая. Красивая. Красивая.»

Алгоритмы глубокого обучения работают потому, что они лучше, чем любой другой человек, отражают сложность, плавность и даже красоту вселенной, в которой все влияет на все остальное одновременно.

Мы начинаем признавать, что истинная сложность мира намного превосходит законы и модели, которые мы разрабатываем, чтобы объяснить это.

Машинное обучение — это лишь один из многих инструментов и стратегий, которые все больше сближают нас с непостижимой сложностью нашего повседневного мира.

Но это преимущество имеет свою цену: мы должны отказаться от нашей настойчивости в том, чтобы всегда понимать наш мир и то, как что-то происходит в нем.

Поверхностное понимание

Мы, люди, уже давно думаем, что если мы сможем просто понять непреложные законы того, как все происходит, мы сможем точно предсказать, спланировать и управлять будущим.

Если мы знаем, как бывает погода, метеосводки могут подсказать нам, стоит ли брать с собой зонтик на работу.

Если мы знаем, что заставляет людей нажимать на одну вещь, а не на другую в своих каналах Facebook, мы можем разработать идеальную рекламную кампанию.

Если мы знаем, как происходят эпидемии, мы можем предотвратить их распространение. Поэтому мы сделали своим делом знать, как все происходит, открывая законы и модели, которые управляют нашим миром.

Учитывая, насколько несовершенными были наши знания, это предположение основывалось на более глубоком.

Наш негласный контракт со вселенной заключался в том, что, если мы будем усердно работать и мыслить достаточно четко, вселенная раскроет свои секреты, поскольку вселенная познаваема и, таким образом, по крайней мере, несколько поддается нашей воле.

Но теперь, когда наши новые инструменты, особенно машинное обучение и интернет, приносят нам огромные объемы данных и информации вокруг нас, мы начинаем признавать, что истинная сложность мира намного превосходит законы и модели, которые мы разрабатываем объяснить это.

Наши новые вместительные машины могут стать ближе к пониманию этого, чем мы, и они, как машины, вообще ничего не понимают.

Это, в свою очередь, ставит под сомнение другое предположение, что мы держим один уровень ниже: вселенная известна нам, потому что мы, люди (как мы предполагали), уникально способны понять, как работает вселенная.

По крайней мере, со времен древних евреев мы считали себя созданиями, уникально созданными Богом, способными получить Его откровение об истине.

Начиная с древних греков, мы определяли себя как разумных животных, которые способны видеть логику и порядок в кажущемся хаосе мира.

Наши самые основные стратегии основывались на этих особых отношениях между нами и нашим миром.

Отказ от этой традиционной самооценки нашего вида мучителен и болезнен.

Чувство подавленности информационной перегрузки и нервное ожидание следующего срыва нашего бизнеса, правительства или культуры — это всего лишь локализованная боль более глубокой болезни: чувство — иногда выражаемое в неловких шутках о росте повелителей роботов — что мы не так уж и хороши адаптированы к нашей вселенной, как мы думали.

Наш разум не может анализировать или предсказывать события так же точно и быстро, как АИ.

Эволюция дала нам сознание, настроенное на выживание и лишь случайно на истину. Наши заявления о том, что делает наш вид особенным — эмоции, интуиция, креативность — начинают звучать чрезмерно и немного отчаянно.

Мы буквально разочаровываемся в этом буквальном разочаровании — и не только потому, что оно происходит независимо от того, принимаем мы это или нет. Мы находимся в начале большого скачка в наших силах понимания и управления будущим: вместо того, чтобы постоянно бороться за наш мир до размеров, которые мы можем прогнозировать, контролировать и чувствовать себя комфортно, мы начинаем строить стратегии, которые принять во внимание сложность нашего мира.

Мы делаем этот скачок, потому что он уже позволяет нам быть более действенными и эффективными, общаясь с большим количеством людей и идей, более творческим, более радостным.

Он уже пересматривает многие из наших самых основных идей и наших наиболее привычных практик в нашей деловой и личной жизни. Это отражается во всех сферах нашей культуры.

Знаки повсюду вокруг нас, но во многих случаях они скрыты в практиках и идеях, которые уже кажутся нормальными и очевидными.

Например, до того, как машинное обучение стало популярным, интернет уже привел нас к этим изменениям.

Тайна A/B

Когда первая президентская кампания Барака Обамы опробовала две версии кнопки регистрации на своем веб-сайте, она обнаружила, что одна из них с надписью «Узнать больше» привлекла гораздо больше кликов, чем та же кнопка с надписью «Присоединяйтесь к нам сейчас» или «Зарегистрируйтесь сейчас».

Другой тест показал, что черно-белая фотография семьи Обамы неожиданно произвела гораздо больше кликов, чем цветное изображение, которое использовалось сайтом.

Затем, когда они добавили кнопку «Узнать больше» вместе с черно-белой фотографией, количество регистраций увеличилось на 40 процентов.

В целом, по оценкам кампании, почти треть из 13 миллионов имен в ее списке электронной почты и около 75 миллионов долларов в виде пожертвований были связаны с улучшением производительности, обеспечиваемой такого рода A/B-тестированием, при котором сайт испытывает варианты объявление или контент на неизвестных наборах случайных пользователей, а затем использует результаты, чтобы решить, какую версию увидят остальные пользователи.

Еще более удивительным было то, что команда Обамы поняла, что видео кандидата, разжигающего толпу на митинге, вызвало гораздо меньше щелчков, чем отображение чисто текстового сообщения.

Чем можно объяснить эту разницу, учитывая талант кандидата в качестве оратора? Команда не знала. И при этом они не должны были знать.

Эмпирические данные говорят им, какой контент размещать на сайте кампании, даже если он не говорит им, почему. Результаты: больше кликов, больше пожертвований, возможно, больше голосов.

A/B-тестирование стало обычной практикой. Результаты, которые вы получаете на странице поиска в Google, являются результатами A / B-тестирования.

Расположение фильмов на Netflix является результатом A/B-тестирования. Даже некоторые заголовки, используемые New York Times, являются результатом A/B-тестирования.

В период с 2014 по 2016 год инженеры-программисты Bing провели 21 200 тестов A/B, треть из которых привела к изменениям в обслуживании.

A/B-тестирование работает без необходимости или генерирования гипотезы о том, почему оно работает.

Почему какая-то реклама на Amazon генерирует больше продаж, если изображение улыбающейся молодой женщины слева, а не справа?

Мы можем составить теорию, но мы все равно будем советовать А/Б проверить положение модели в следующем рекламном объявлении, которое мы создадим.

То, что черно-белая фотография сработала для Обамы, не означает, что его противник, Джон Маккейн, должен был бросить свои цветные фотографии.

То, что использование голубого фона вместо зеленого использовалось для подачи Amazon на гриль под открытым небом, не дает нам оснований думать, что оно подойдет для внутреннего гриля или для книги рецептов барбекю.

При A/B-тестировании у нас часто нет ментальной структуры, которая объясняет, почему одна версия объявления работает лучше, чем другая.

Фактически, вполне вероятно, что факторы, влияющие на предпочтения людей, являются микроскопическими и мимолетными.

Возможно, мужчины старше 50 лет предпочитают рекламу с моделью слева, но только если они идут со страницы со смешным заголовком, в то время как женщины из Детройта предпочитают модель справа, если солнце только что заглянуло в их окна после двух пасмурных дней.

Возможно, некоторые люди предпочитают черно-белое фото, если они просто смотрят высококонтрастное видео, а другие предпочитают цветную версию, если янки только что проиграли игру.

Возможно, появятся некоторые обобщения, возможно и нет. Причины могут быть такими же разными, как и сам мир.

Мы были воспитаны, чтобы поверить, что истина и реальность мира выражены горсткой неизменных законов.

Изучите законы, и вы сможете делать прогнозы.

Откройте для себя новые законы, и вы сможете предсказать больше вещей. Если кто-то хочет узнать, как вы пришли к прогнозу, вы можете ознакомиться с законами и данными, которые вы в них включили.

Но с A/B-тестированием у нас часто нет ментальной структуры, которая объясняет, почему одна версия объявления работает лучше, чем другая.

Подумайте о том, чтобы бросить пляжный мяч. Вы ожидаете, что шар будет дугообразным при движении в общем направлении, в которое вы его бросили, для нашей ментальной модели — набора правил того, как мы думаем, что вещи взаимодействуют — учитываются сила тяжести и импульс.

Если мяч движется в другом направлении, вы не выбрасываете модель. Скорее вы предполагаете, что упустили какой-то элемент ситуации; возможно, был порыв ветра, или ваша рука поскользнулась.

Это именно то, что мы не делаем для A/B-тестирования. Нам не нужно знать, почему черно-белая фотография и ярлык «Подробнее» увеличили пожертвования на одну конкретную кампанию.

Если уроки, которые мы извлекли из рекламы демократа, не работают на ее республиканскую оппозицию — а они вполне могут этого не делать — это тоже хорошо, потому что это достаточно дешево, чтобы просто провести еще один A/B тест.

A/B-тестирование является лишь одним из примеров техники, которая незаметно показывает нам, что принципы, законы и обобщения не так важны, как мы думали.

Может быть, может быть, принципы — это то, что мы используем, когда не можем справиться с мелочами реальности.

Эффективность сложности

Мы только что рассмотрели примеры двух совершенно разных компьютерных технологий: метод программирования (машинное обучение) и глобальное место (интернет), где мы встречаемся с другими, и их выражения смысла и творчества.

Конечно, эти технологии часто объединяются: машинное обучение использует Интернет для сбора информации в необходимом масштабе, и все больше и больше интернет-сервисов используют как машинное обучение, так и его подачу.

Эти две технологии также имеют как минимум три общие черты, которые учат нас тому, как устроен мир: обе огромны. Оба связаны. Оба сложны.

Их огромность — их масштаб — не из тех, с которыми мы сталкиваемся, когда мы посещаем дом самого большого в мире клубка шпагата или представляем всю картошку в мире в одной куче.

Важность огромности как машинного обучения, так и Интернета — это уровень детализации, который они обеспечивают.

Вместо того, чтобы избавляться от деталей путем обобщения или подавления «маргинальной» информации и идей, обе эти технологии процветают благодаря деталям и уникальности.

Связность обеих этих технологий означает, что содержащиеся в них кусочки и кусочки могут воздействовать друг на друга, не оглядываясь назад на барьеры, которые накладывает физическое расстояние.

Эта связность имеет важное значение для обеих этих технологий: сеть, соединяющая одно устройство с другим по одному, была бы не Интернетом, а старой телефонной системой.

Связность наших новых технологий огромна, многогранна, не требует большого расстояния и необходима.

Масштаб и связанность машинного обучения и Интернета приводит к их сложности.

Связи между огромным количеством фрагментов могут иногда приводить к цепочкам событий, которые заканчиваются дико далеко от того места, где они начались.

Крошечные различия могут заставить эти системы делать неожиданно крутые повороты.

Мы не используем эти технологии, потому что они огромны, связаны и сложны. Мы используем их, потому что они работают.

Наш успех с этими технологиями, а не с самими технологиями, показывает нам мир более сложным и хаотичным, чем мы думали, что, в свою очередь, побуждает нас исследовать новые подходы и стратегии, бросая вызов нашим предположениям о природе и важности понимание и объяснения, и в конечном итоге приводит нас к новому пониманию того, как все происходит.

 

Подписывайтесь на наш Telegram канал



Самые актуальные новости - в Telegram-канале

Читайте также

Вверх