Аналитика данных и машинное обучение достигают больших успехов. Но это просто следующая возможность в продолжающейся эволюции производства, хранения, совместного использования данных и сетевого обучения.
Развитие данных…
- Недостаток данных - В начале 1990-х и ранее данных было довольно мало, как из-за низкого уровня производства данных (по сравнению с сегодняшним днем), так и из-за того, что механизмы хранения и обмена данными были более ограниченными.
- Производство данных - 2000-е годы стали веком сенсоров. С развитием электроники датчики стали более доступными. Следовательно, производство датчиков и разнообразие новых датчиков значительно увеличилось. Благодаря огромному количеству развернутых датчиков объем производства данных рос - и продолжает расти - в геометрической прогрессии.
- Хранение данных - с ростом производства данных возросла потребность в экономичном хранении данных. В масштабе хранилище данных стало настолько дешевым, что оно приближается к незначительной стоимости, пока объемы данных не станут огромными.
- Обмен данными - в 1990-х годах компании генерировали свои собственные внутренние данные, но они в основном не передавались за пределы компании. Также не было общих знаний, кроме как в печатном виде. С появлением Интернета и его последующим широким распространением (1993+) обмен данными стал более распространенным, чем когда-либо прежде (особенно с распространением API-интерфейсов), но он оставался в значительной степени неструктурированным.
- Структурирование данных - технически подкованные отраслевые эксперты увидели повторяющиеся закономерности в доступных наборах информации и начали структурировать их, по одной отраслевой вертикали за раз. Следующим «смежным возможным» вариантом были сбор и сопоставление (примерно 2004–2016 гг.). Фактически, именно так PrivateEquityInfo.com начал свою деятельность в 2004 году. Я обнаружил возможность структурировать данные по частным инвестициям и связанным с ними фирмам и мероприятиям M&A. Это сэкономило людям огромное количество времени на поиск информации и создание профессиональных сетей, а также повысило эффективность заключения сделок M&A.
- Аналитика данных - благодаря структурированным данным у нас появилась возможность с помощью алгоритмов анализировать и выявлять тенденции в данных с течением времени, как никогда раньше. Это помогло нам лучше понять исторический контекст и сделать прогнозы на будущее на основе исторических тенденций (2008+). Он также дает полезную информацию, по крайней мере, в направлении.
- Большие данные - по мере того, как данные становились все более полезными для принятия решений, мы начали собирать их все больше и больше. При наличии данных (и достаточной вычислительной мощности) чем больше, тем лучше (при условии, что качество данных не ухудшается при расширении данных… часто ошибочное предположение).
- Интеллектуальные данные и машинное обучение - поскольку сбор структурированных данных с датчиков и различных входных данных начал значительно опережать нашу (человеческую) способность не отставать от них, мы начали использовать методы машинного обучения для установления взаимосвязей в данных и создания более совершенных предсказателей и индикаторов будущего. Машинное обучение, основанное на больших объемах данных, намного мощнее алгоритмов, написанных человеком. Из огромных объемов данных машины могут выявить закономерности, недоступные человеку. Они могут учиться быстрее, выявлять причинные корреляции в данных и, таким образом, предсказывать результаты с большей точностью, чем люди. Умные алгоритмы, основанные на машинном обучении и управляемые данными, в сочетании с огромным количеством данных теперь приблизительно соответствуют интеллекту - искусственному интеллекту (2015+).
Что дальше?
Сетевое обучение - в 2018+ машины создают данные, делают их доступными в заранее определенных структурированных форматах, делятся этими данными с другими машинами и заставляют сеть машин учиться друг у друга. Машина супер-интеллект. Он более точно моделирует сложную сеть человеческого мозга, за исключением большей вычислительной мощности, большей емкости хранения и более быстрого поиска информации. Это не особенность, но это будет огромный скачок вперед - до такой степени, что интеллект, производимый машинами, не будет казаться таким искусственным.