Руководство по инвестициям в ИИ:закладка основы (часть I)

ETFFIN >> Личные финансы > >> Финансовый менеджмент >> Корпоративное финансирование

Резюме

Что такое ИИ?

Искусственный интеллект (ИИ) можно просто объяснить как интеллект, демонстрируемый машинами, в отличие от естественного интеллекта, демонстрируемого людьми и другими животными.
Машинное обучение — это подмножество методов, используемых в ИИ, а глубокое обучение — это подмножество методов, используемых в машинном обучении.
В развитии ИИ было три значительных волны. Первый в 50-х и 60-х годах, второй в 80-х и 90-х годах, а третий начался десять лет назад и получил известность с 2016 года (AlphaGo).

Что особенного в этой волне ИИ?

Эта волна искусственного интеллекта обусловлена ростом и популярностью глубокого обучения.
Несмотря на то, что методы глубокого обучения существуют с 60-х годов, требуемая вычислительная мощность и данные не были достаточно развиты для поддержки массового коммерческого применения до последних нескольких лет.
Причина, по которой глубокое обучение так увлекательно, заключается в том, что, проще говоря, глубокое обучение обеспечивает гораздо более высокую производительность, чем другие алгоритмы обучения.

Ключевые компоненты успешных приложений ИИ.

Приложения ИИ должны решать четко определенные (конкретные) и желаемые (нацеленные на неотложные и четкие проблемы клиентов) проблемы. Распознавание лиц, машинный перевод, беспилотные автомобили, поисковая оптимизация — все это четко определенные желательные проблемы. Однако из-за отсутствия четко определенных желательных задач трудно создать, например, обычного робота для уборки дома.
Алгоритмы машинного обучения требуют доступа к чистым и хорошо размеченным данным. Это упражнение по сбору данных может быть сложным или легким, в зависимости от того, какое коммерческое приложение вы разрабатываете.
Компании, занимающейся искусственным интеллектом, необходимо разработать надежные и масштабируемые алгоритмы. Для этого необходимы три условия:большой объем хорошо размеченных данных, правильный талант и уверенность в том, что глубокое обучение — это правильная технология для решения проблемы.
Успешные приложения ИИ требуют больших вычислительных мощностей. Чем более совершенен алгоритм искусственного интеллекта (например, нейронные сети с глубоким обучением), тем больше вычислительной мощности требуется, тем дороже выполняемая операция.

За последние несколько лет мир стал свидетелем взрыва интереса к искусственному интеллекту (ИИ). Концепция ИИ, которая когда-то ограничивалась в основном жанром научной фантастики, стала частью нашей повседневной жизни. Мы постоянно читаем об этом в новостях, смотрим видеоролики о страшных роботах, танцующих под мотив Uptown Funk. , и узнайте о том, как приложения ИИ проникают даже в самые неожиданные сферы нашей повседневной жизни. Но разве это реклама?

Возможно. Согласно отчету Gartner Hype Cycle for Emerging Technologies, тенденции демократизации ИИ, включая AI PaaS (платформа как услуга), общий искусственный интеллект, автономное вождение, глубокое обучение, находятся в разных точках кривой, а глубокие нейронные сети находятся на пике популярности. завышенные ожидания. Тем не менее, мы уже каждый день извлекаем пользу из ИИ. От Siri до Cortana и Alexa теперь мы можем общаться с умными помощниками. От поисковой системы Google на основе искусственного интеллекта до фильтров Instagram — теперь мы наслаждаемся удобством быстрого и более релевантного ответа на наши потребности. В Китае, где процветают инновации в области искусственного интеллекта, такие компании, как технология распознавания лиц Face++, обеспечивают мгновенную идентификацию личности для банков, в то время как приложения, такие как TikTok, предлагают короткие видеоролики миллионам подростков (фактически вызывая серьезные споры при этом).

Лично я считаю, что, несмотря на некоторые завышенные ожидания и бизнес, за искусственным интеллектом будущее. . Я основал свой собственный стартап ИИ на ранней стадии, чтобы воспользоваться этой выпадающей раз в жизни возможностью поучаствовать в технологической революции. Как бывший венчурный инвестор, я также постоянно ищу возможности для инвестиций в ИИ. Поэтому я считаю, что, несмотря на бесспорный шум вокруг космоса, огромный всплеск инвестиций в ИИ также оправдан.

Но с учетом этого меня удивляет, что, особенно среди инвестиционного сообщества, все еще существует большой пробел в понимании. Инвесторы стремятся заставить деньги работать, но им часто не хватает важных базовых знаний, которые, на мой взгляд, необходимы для эффективного инвестирования в этой области. Таким образом, цель этой статьи состоит в том, чтобы поделиться и предоставить полезный контекст и информацию для тех, кто заинтересован в инвестировании в эту захватывающую область. Учитывая широту обсуждаемой темы, я разделил свои мысли на две части, первая из которых была посвящена обсуждению нескольких основных элементов, которые необходимо знать, чтобы начать путешествие по ИИ — своего рода 101. Вторая часть этой серии статей будет более практической и более подробно расскажет о том, как оценивать инвестиции в ИИ и о различных способах инвестирования.

Н.Б. Этот пост не носит технический характер. Он предназначен для инвесторов и более широкого финансового сообщества и, следовательно, для нетехнических читателей.

Что такое ИИ?

На самом деле существует множество определений ИИ, поэтому, когда меня просят дать ему определение, я часто по умолчанию использую старую добрую Википедию, которая, как мне кажется, дает удовлетворительное определение для нетехнической аудитории:

<цитата>

Искусственный интеллект (ИИ), иногда называемый машинным интеллектом, представляет собой интеллект, демонстрируемый машинами, в отличие от естественного интеллекта, которым обладают люди и другие животные.

Другими словами, любой неестественный интеллект является «искусственным» интеллектом, независимо от того, как он достигается. Методы, используемые для достижения ИИ, включают правила «если-то», логику, деревья решений, регрессии и машинное обучение, включая глубокое обучение. Один из моих любимых и забавных инструментов для объяснения того, как работает ИИ, — это видео о том, как компьютер учится играть в Super Mario.

Говоря об ИИ, вы неизменно будете слышать эти три ключевых термина:ИИ, машинное обучение и глубокое обучение. Иногда они используются взаимозаменяемо, но они разные. Проще говоря, машинное обучение — это подмножество методов, используемых в ИИ. Глубокое обучение — это подмножество методов, используемых в машинном обучении. .

Блог Nvidia хорошо резюмирует взаимосвязь между тремя терминами. Он также предоставляет удобный обзор трех волн развития ИИ. Первая волна ИИ пришлась на 50-е и 60-е годы и ознаменовалась одними из первых важных вех, например, когда IBM 701 выиграл игру в шашки над мастером шашек Робертом Нили. В 80-х и 90-х годах Deep Blue обыграл в шахматы человеческого мастера Каспарова. В марте 2016 года AlphaGo обыграла игрока №1 в го Ли Седоля. Каждый раз, когда ИИ побеждал мастеров-людей в играх, это вызывало новую волну ажиотажа вокруг ИИ. Затем, поскольку технология не могла предоставить приложения, отвечающие ожиданиям общественности, ажиотаж вокруг ИИ превратился бы в зиму ИИ с сокращением инвестиций и грантов на исследования.

Как упоминалось ранее, машинное обучение является подмножеством ИИ. Согласно Nvidia, машинное обучение в своей основе — это «практика использования алгоритмов для анализа данных, извлечения уроков из них, а затем определения или прогнозирования чего-либо в мире. Таким образом, вместо того, чтобы вручную кодировать программные процедуры с определенным набором инструкций для выполнения конкретной задачи, машина «обучается» с использованием больших объемов данных и алгоритмов, которые дают ей возможность научиться выполнять задачу». Очень распространенным примером машинного обучения является спам-фильтр. Спам-фильтр Google может распознавать спам, определяя триггерные слова, такие как «принц», «Нигерия» и «роскошные часы». Он также может продолжать «учиться» на пользовательской классификации спама. Например, электронное письмо с сообщением «отправьте 1000 долларов, чтобы получить это эксклюзивное лекарство от рака на следующий банковский счет» было пропущено спам-фильтром Google. Как только пользователь помечает письмо как спам, Gmail анализирует все ключевые слова в этом конкретном письме и «учится» обрабатывать электронные письма, содержащие сочетания слов «1000 долларов США», «наркотик» и «банковский счет», как спам в будущем. Есть много математических моделей, используемых профессионалами для машинного обучения, например. регрессии, логистика, байесовские сети, кластеризация.

Что особенного в этой волне ИИ?

Эта волна искусственного интеллекта вызвана популярностью глубокого обучения. . Как подмножество машинного обучения, глубокое обучение было изобретено не так давно. На самом деле, согласно Википедии, «первый общий рабочий алгоритм обучения для контролируемых, глубоких, многослойных персептронов с прямой связью был опубликован Алексеем Ивахненко и Лапой в 1965 году». Однако, поскольку вычислительная мощность и данные не были достаточно развиты для поддержки массового коммерческого применения методов глубокого обучения, они не пользовались популярностью до 2006 года, когда Джеффри Хинтон и др. опубликовали свою основополагающую статью «Алгоритм быстрого обучения для глубокого убеждения». сети». Несмотря на зиму ИИ 90-х и первую половину 2000-х, несколько ученых, в том числе три академических гуру глубокого обучения, Джеффри Хинтон, Янн ЛеКун и Йошуа Бенжио, продолжают работать над глубоким обучением в академической сфере. Быстрый прорыв вычислительной мощности, например, облачных вычислений и графических процессоров, в сочетании с доступностью больших данных благодаря цифровой экономике, сделал возможным внедрение алгоритмов глубокого обучения в последнее десятилетие. Например, исследование беспилотных автомобилей Google началось в 2009 году.

С технической точки зрения глубокое обучение можно определить как «класс алгоритмов машинного обучения, которые:

используйте каскад из нескольких уровней нелинейных блоков обработки для извлечения и преобразования признаков. Каждый последующий слой использует выходные данные предыдущего слоя в качестве входных данных.
обучайтесь под учителем (например, классификация) и/или без учителя (например, анализ шаблонов).
изучить несколько уровней представления, соответствующих разным уровням абстракции; уровни образуют иерархию понятий».

Ключевым моментом является «многоуровневость» по сравнению с традиционным машинным обучением. Например, как бы вы отличили кошку от собаки? Если бы вы использовали машинное обучение, вы могли бы выделить несколько признаков, общих для собак и кошек, таких как два уха, пушистая морда, расстояние между глазами, носом и ртом и т. д. И вы могли бы получить результат, говорящий на картинке 50% собака, 50% кошка - не очень полезно. Однако, используя глубокое обучение, вы даже не знаете, в чем заключаются отличительные черты кошки и собаки, но машина, благодаря многоуровневому созданию новых функций и сотням (или тысячам) статистических моделей, предоставит более подробную информацию. точный вывод - например. 90% собака, 10% кошка. На двух диаграммах ниже показано, как нейронная сеть «обучается», а также разница между классическим машинным обучением и нейронными сетями.

Читатели могут почесать затылок после прочтения вышеизложенного, и это правильно. Но вернемся к нашей первоначальной цели:с точки зрения инвестора, что такого особенного в глубоком обучении? Можно было бы ответить на этот вопрос с помощью различных дополнительных сложных технических объяснений, но на самом деле просто говоря, график ниже слева делает большую работу, чтобы сделать его действительно ясным:глубокое обучение обеспечивает гораздо более высокую производительность, чем другие алгоритмы обучения. Возьмем пример распознавания речи, подробно описанный в блоге Microsoft (диаграмма ниже справа):первоначальный уровень ошибок распознавания речи в 1988 году составлял 60–70 %, тогда как в новой системе Microsoft, использующей глубокое обучение, в 2014 году этот показатель составлял всего 6,3 %.

Ключевые компоненты успешных приложений ИИ

Я считаю, что успех продукта машинного обучения (включая глубокое обучение) состоит из четырех ключевых компонентов:четко определенные желаемые задачи, данные, алгоритм(ы) и вычислительная мощность .

Прежде всего, приложение ИИ должно решать четко определенную (конкретную) и желательную (нацеленную на срочные и четкие болевые точки клиента) проблему. . Подумайте о разных играх, в которые компьютер научили играть на трех разных волнах ИИ:шашки, шахматы, го. Это были очень четко определенные проблемы, и поэтому компьютеру было легче их решить. Распознавание лиц, машинный перевод, беспилотные автомобили, поисковая оптимизация — все это четко определенные желательные проблемы. Однако отсутствие четко определенных желательных задач является причиной того, что так сложно создать, например, робота для уборки дома. Простые домашние дела, например. собирать чашки и складывать белье в корзину, требуют решения слишком многих проблем. Например, требуется, чтобы машина определила, какие предметы нужно подобрать (чашки, грязное и нечистое белье и т. д.), куда и как идти (обходить препятствия в доме и добираться до нужного места). расположение), манипулируя каждым предметом с нужной силой, чтобы он не разбил чашку, белье и т. д.

Во-вторых, для разработки алгоритма машинного обучения требуется доступ к чистым и хорошо размеченным данным. . Это связано с тем, что эти алгоритмы строятся путем подачи в различные статистические модели большого количества хорошо размеченных данных для установления необходимых прогностических взаимосвязей. Это упражнение по сбору данных может быть сложным или простым, в зависимости от того, какое коммерческое приложение вы разрабатываете. Например, для сбора необходимых данных, необходимых для разработки алгоритма компьютерного зрения для виноградных полей, моему стартапу нужны были изображения полей из разных мест с разными сортами и, что еще сложнее, — с разными сезонами. Поскольку каждый сезон длится один год, потребуются годы, чтобы получить удовлетворительные продукты. Напротив, если вы хотите разработать хороший алгоритм распознавания лиц в Китае, для сбора, например, 10 миллионов изображений, вам просто нужно установить камеру на оживленной улице в Пекине на неделю, и задача будет выполнена. Другим примером может служить агрегатор персонализированных новостей №1 на базе искусственного интеллекта в Китае, Toutiao, который узнает о ваших личных новостных предпочтениях и показывает вам только самые актуальные новости. Сбор данных в этом случае снова намного проще, т.е. количество статей, которые вы читаете в каждой категории новостей, количество времени, которое вы тратите на каждую статью, и т. д.

В-третьих, ИИ-бизнесу необходимо разработать надежные и масштабируемые алгоритмы. . Для этого необходимы три условия:большой объем хорошо размеченных данных (как обсуждалось выше), правильный талант и уверенность в том, что глубокое обучение — это правильная технология для решения проблемы. Для разработки необходимых алгоритмов бизнесу в области искусственного интеллекта нужны таланты, но они узкоспециальны, дороги и дефицитны. Например, когда я искал сотрудников для своего стартапа, я обнаружил, что мне нужны как минимум специалисты по данным (обычно с докторской степенью) для разработки прототипов алгоритмов, инженеры для разработки фреймворков, программисты (TensorFlow, Python, C++ и т. д.) для написания кода. в масштабируемые программы и людей, которые их объединяют (менеджер по продукту, UX, UI и т. д.).

Еще одним соображением является вычислительная мощность. . Почему? Потому что нейронные сети глубокого обучения требуют гораздо больше вычислений, чем другие методы ИИ. Например, для той же задачи идентификации собаки на изображении для обучения модели с использованием алгоритма неглубокого обучения может потребоваться, скажем, 10 статистических моделей с набором данных объемом 1 ГБ. Для модели глубоких нейронных сетей может потребоваться, скажем, 1000 статистических моделей, обрабатывающих набор данных объемом 100 ГБ. Результаты лучше при использовании сетей, но требуемая вычислительная мощность намного выше. В результате для этих моделей требуется не один компьютер (как мы делаем на нашем персональном компьютере), а распределенные вычисления, при которых каждый графический процессор обрабатывает, скажем, 5% вычислений, так что 20 графических процессоров вместе могут справиться с требуемым вычислительным объемом. Это, в свою очередь, означает необходимость создания собственных кластерных серверов графических процессоров или аренду вычислительной мощности у таких платформ, как AWS. Вычислительная мощность облачных вычислений или собственных серверов обходится дорого, хотя, справедливости ради, удельная стоимость вычислений должна постоянно снижаться (согласно закону Мура).

Заключение

Многие считают, что сейчас самое подходящее время, чтобы увидеть прорывы и стартапы в области искусственного интеллекта, потому что цифровизация многих отраслей и потребительского интернета делает доступными большие объемы целенаправленно собранных, четко организованных цифровых данных. Развитие графического процессора Nvidia и FPGA Intel значительно удешевляет и ускоряет проведение необходимых вычислений. Поэтому нынешняя волна инноваций в области искусственного интеллекта обусловлена важными достижениями в области глубокого обучения. .

Но чтобы приложение ИИ было успешным, нужна четко определенная желаемая задача, данные, алгоритм и значительная вычислительная мощность. Для руководителей, читающих эту статью, которые рассматривают возможность использования ИИ для расширения возможностей своего бизнеса, также применимы четыре упомянутых выше ключевых компонента.

Как узнать больше об ИИ? Существует множество книг, семинаров, курсов Coursera, исследовательских работ и организаций, таких как Deep Learning, для изучения ИИ. Поскольку эта статья предназначена для инвесторов, которые хотят знать основы ИИ, я не затронул многие горячие темы ИИ, такие как потенциал ИИ как угрозы, перспективы отрасли на будущее, инвестиции в ИИ, преимущества а также недостатки различных алгоритмов (например, CNN), прототипирование и масштабирование, основные языки программирования и т. д. Во второй части этой серии статей я расскажу, как оценивать компании, занимающиеся искусственным интеллектом, с точки зрения инвестора.

Как добраться до греков:полное руководство по ценообразованию опционов Изучение функциональности Excels Get &Transform

Корпоративное финансирование