Эрик Берлоу: Я экологист, а Шон физик, мы оба изучаем сложные системы. Мы познакомились пару лет назад, после того как узнали, что оба выступали на TED с короткой речью на тему «Экология войны», и мы поняли, что уже до нашей встречи были соединены общей идеей. Тогда мы подумали о том, что есть тысячи других выступлений, особенно выступлений на конференциях TEDx, появляющихся там и тут по всему миру. Как они соединены и как выглядит этот всемирный разговор? Итак, Шон собирается рассказать вам о том, что мы делали.
Шон Горли: Точно. Мы взяли 24 000 выступлений на конференциях TEDx в 147 разных странах. Мы отобрали выступления с целью найти математические формулы, лежащие в основе идей, на которых основаны выступления. Мы решили сделать это, чтобы можно было увидеть, как выступления связаны друг с другом.
Конечно, чтобы начать заниматься такой деятельностью, нужно собрать много данных. А данные можно получить на замечательном видео-хостинге под названием YouTube. Мы взяли и буквально извлекли всю открытую информации из этого источника, все комментарии, все просмотры, информацию про то, кто что смотрел, где этот человек находится и что говорят в комментариях. Но также можно найти информацию, используя преобразование речи в текст, записывая таким образом все выступления; это можно сделать даже с выступлениями людей со смешным акцентом, как, например, я. Итак, мы берём записи и делаем с ними несколько любопытных манипуляций. Мы используем алгоритмы обработки текстов на естественных языках, чтобы построчно прочитать записи с помощью компьютера, одновременно извлекая основные данные. Потом мы берём эти данные и формируем из них математическую формулу идеи. Мы назвали это «мем-ом» [открытая среда передачи сообщений]. Говоря простыми словами, мем-ом — это математика, лежащая в основе идеи, и с ней мы можем провести очень интересные исследования. Сейчас я хочу поделиться с вами тем, что у нас получилось.
У каждой идеи есть свой собственный мем-ом, и поэтому каждая идея уникальна, но, конечно, идеи друг у друга что-то заимствуют, иногда даже крадут, и они, безусловно, друг на друге построены. Мы можем рассмотреть этот процесс с точки зрения математики: берём мем-ом из одного выступления и сравниваем его с мем-омом из другого выступления. Если между ними двумя есть что-то общее, можно создать связь и изобразить её в диаграмме; такая же диаграмма показывает связь между мной и Эриком.
Это теория звучит замечательно. Давайте посмотрим, как это работает на практике. Здесь мы видим глобальные отпечатки всех выступлений на конференциях TEDx за последние четыре года, вспыхнувших по всему миру, от Нью-Йорка до маленькой старой Новой Зеландии в углу. Мы проанализировали первые 25% этой информации, и это помогло нам увидеть, где связь только начинала появляться, а где она возникла. Вот выступление Кэмерона Рассела на тему имиджа и красоты, связанное с Европой. А вот выступление побольше на тему отношений между Израилем и Палестиной, и к нему связи протягиваются, как лучи, от Ближнего Востока. И есть нечто более всеохватывающее, большие данные с действительно глобальными отпечатками, напоминающие разговор, это можно увидеть повсюду на проекции.
Однако здесь мы сталкиваемся с ограничениями, которые нам даёт использование географической проекции, но, к счастью, компьютерные технологии позволяют нам справиться с этой проблемой и выйти в многомерное пространство. Мы берём нашу сетевую проекцию и применяем к ней физический движок, в результате похожие выступления разбиваются, а непохожие расходятся в стороны, и то, что мы получаем в результате, напоминает красивую картинку.
ЭБ: Я хочу просто подчеркнуть, что каждая узловая точка — это выступление, точки связаны, если разделяют похожие идеи. Мы смогли получить такой результат, используя машинное чтение записей всех выступлений; тэги и ключевые слова не выдадут вам эти темы. Мы смогли получить эти данные только благодаря сетевой структуре взаимосвязанных идей. Продолжай.
SG: Абсолютно верно. Я немножко забежал вперед, но Эрик заставил меня вернуться к этой теме. Итак, вот образование, связанное с повествованием и социальными СМИ, это чем-то похоже на треугольник. Конечно, мозг человека находится рядом со здравоохранением, этого следовало ожидать, а вот видеоигры относятся к смежной области, потому что две этих области соприкасаются друг с другом.
Но я хочу показать вам одно скопление, особенно важное для меня, — это окружающая среда. Хочу показать его крупным планом и посмотреть, можем ли мы получить большее разрешение. Мы заходим сюда и мы видим, применяя физический движок ещё раз, мы видим, что это выступление на самом деле состоит из многих маленьких. Структура начинает вырисовываться, мы видим своего рода фрактальное поведение слов и языка, которые используем для описания вещей, важных для нас в окружающем мире. Итак, пищевая промышленность и местные продукты питания находятся в верхней части, а здесь находятся парниковые газы, отработанные солнечные батареи и ядерное топливо. В результате мы вышли на уровень более маленьких выступлений, связанных между собой идеями и общим языком. Всё это помогает глубже понять окружающий мир. И, конечно, отсюда мы можем перейти сюда, увеличить и посмотреть, что же интересно таким молодым людям как вы. Вам интересны энергетические технологии и ядерный синтез. Это ваш вклад в мировой разговор. Если мы разделим группы по половому признаку, то увидим, что женщинам больше интересна пищевая промышленность, надежда и оптимизм — они где-то там на схеме.
Таким образом мы можем узнать много интересного. А сейчас пред вами выступит Эрик.
ЭБ: Да, я просто хотел заметить, что эту информацию вы не найдёте на YouTube, набирая слова в поисковике. А теперь давайте вернёмся к всемирному разговору, сосредоточим внимание только на выступлениях. Когда мы сталкиваемся с новой информацией, мы часто выполняем ряд действий, чтобы сделать её проще и понятнее. Другими словами, о чём больше всего любят говорить на конференциях TED? Давайте посмотрим на экран. Есть выступление о благодарности. Ещё одно — о личном здоровье и питании. И, конечно, должно быть ещё одно про порно, да? Мы видим, что выступления на тему благодарности были популярны в прошлом году. А что сейчас в моде? О чём сейчас любят говорить? Мы видим, что новая недавно появившаяся очень актуальная тема — это тема цифровой конфиденциальности.
Отлично. Эта картина значительно упрощает вещи. Но ведь есть ещё много выступлений с уникальным содержанием, которые просто похоронены внизу. Мне это совсем не нравится. Как сделать так, чтобы эти творческие и интересные выступления всплыли на поверхность? Для этого нам нужно вернуться к сетевой структуре идей. Запомните, сетевая структура создаёт появляющиеся темы; предположим, что мы можем взять отсюда любые две темы, например, про города и про генетику, и сказать, что есть некое выступление, которое может творчески соединить эти две разные области. И это... Такого рода творческий ремикс является одной из отличительных особенностей инноваций. Вот, например, одно из выступлений Джессики Грин о микробиальной экологии зданий. Оно буквально формирует новую область, и мы можем вернуться к этим темам и сказать, какие выступления играют главную роль в этих выступлениях. В теме о городе одно из самых центральных выступлений было у Митча Джоакима об экологических городах, а в теме о генетике мы видим выступление Крейга Винтера о синтетической биологии. Эти выступления связаны с другими в границах своей области. Можно посмотреть что-то другое, например, какие выступления часто синтезируются в различных областях. Чтобы это узнать, мы использовали понятие «экологическое разнообразие». Вот выступление Стивена Пинкера на тему истории насилия, оно очень синтетическое.
И конечно, есть выступления, которые настолько уникальны, что они находятся в своего рода стратосфере, на особом месте, мы называем это индексом Коллин Флэнэган. Если вы про неё не слышали, скажу, что она художник; я как-то спросил её: «Как ты себя чувствуешь там, в стратосфере нашего космоса идей?» Наверно, там пахнет беконом. Я не знаю. Поэтому мы используем повторяющиеся узоры нашей сети, чтобы найти уникальные выступления, те, которые творчески синтезируют множество различных сфер, те, которые занимают центральное место в своей области, и те, которые творчески соединяют несоединимые темы. Всё понятно? Мы очень одержимы этой темой, но сами бы никогда не смогли найти эти данные. Вся эта схема получена в результате построения многих составляющих или образцов того, как связаны вещи.
SG: Именно так. Мы находимся в мире, который чрезвычайно сложен, и мы используем алгоритмы, чтобы отфильтровать лишнюю и ориентироваться в оставшейся полезной информации. Эти алгоритмы одновременно и очень полезные, и очень, очень ограниченные, но мы можем использовать их, чтобы увидеть, что не случайно окружающий мир так запутан. У этой сложности есть математическая формула. Мы можем использовать эту формулу, чтобы изучать такие понятия, как, например, мир идей, и увидеть, на какие темы люди говорят, а на какие нет, стать немножко человечнее и, надеюсь, немного умнее.
Спасибо.
(Аплодисменты)