Метка: ИИ и роботы

Запуск GPT-4

В июне 2018 года исследователи компании OpenAI, базирующейся в Калифорнии, опубликовали исследование о “Генеративном предварительно обученном трансформере” (GPT). До этого лучшие языковые модели искусственного интеллекта (ИИ) в основном использовали обучение с учителем на основе большого количества вручную размеченных данных. Эта зависимость от обучения с учителем ограничивала их использование на неразмеченных наборах данных, а также делала обучение крайне дорогостоящим и затратным по времени для обучения очень больших моделей.

В отличие от этого подход GPT включал в себя этап ненадзорного генеративного “предварительного” обучения, используемый для установки начальных параметров, а затем этап “настройки” для адаптации этих параметров к целевой задаче. GPT имел 117 миллионов параметров, которые можно было рассматривать как примерно эквивалентные отдельным соединениям в мозгу. Новая архитектура GPT обеспечивала более структурированную память, что приводило к “устойчивой переносимой производительности на различных задачах”.

Исследования OpenAI привели к более продвинутой версии с размером набора данных и количеством параметров в 10 раз больше. Как и ее предшественник, GPT-2 использовал ненадзорную модель трансформатора, обученную создавать текст, предсказывая наиболее вероятное следующее слово в последовательности токенов. Продолжая предсказывать дополнительные слова, он мог соединять полные предложения и абзацы с полностью понятными (и семантически значимыми) утверждениями на естественном языке, несколько похожим на очень продвинутую форму автокоррекции на смартфонах. Большой набор данных позволил GPT-2 выполнять задачи за пределами простого создания текста: такие как ответы на вопросы или краткое изложение и даже перевод между языками в различных конкретных областях без предварительной инструкции.

GPT-3, выпущенный в июне 2020 года, поднял исследования на новый уровень. Он имел количество параметров 175 миллиардов, более чем в 100 раз больше, чем у GPT-2, и требовал 800 ГБ хранилища. Около 60% взвешенного набора данных для предварительного обучения GPT-3 было получено из отфильтрованной версии Common Crawl – открытого хранилища данных веб-сайтов, состоящего из 410 миллиардов байт-парных закодированных токенов. Другие источники текста включали WebText2 – корпус веб-сайтов, связанных с сообщениями Reddit с тремя или более положительными отзывами, а также Википедию и цифровые книги.

The New York Times описала способность GPT-3 генерировать естественно звучащий язык, включая компьютерный код, наряду с поэзией и прозой, не только как «удивительный», «жуткий» и «унизительный», но и как «более чем ужасающий». В обзоре Wired говорится, что от GPT-3 «бегут мурашки по всей Силиконовой долине».

Однако некоторые остались настроены скептически, в том числе сам генеральный директор OpenAI Сэм Альтман, который раскритиковал то, что он назвал «ажиотажем вокруг GPT-3», признав, что он имеет «серьезную слабость и иногда делает очень глупые ошибки… ИИ собирается изменить мир, но GPT-3 — это всего лишь очень ранний проблеск».

Растущее использование технологий автоматической генерации текста, основанных на GPT-3 и других языковых генераторах, привело к спорам об академической честности и о том, как школы и университеты должны оценивать, что представляет собой академические проступки, такие как плагиат. Опасения также возникли из-за возможности распространения дезинформации, в том числе предвзятого, сексистского, расистского и другого вредоносного контента, создаваемого ботами. В одном случае французский медицинский стартап протестировал GPT-3 в качестве медицинского чат-бота, который посоветовал вымышленному пациенту покончить жизнь самоубийством.

Тем не менее, GPT-3 оказалась чрезвычайно впечатляющей технологией во многих областях. Продолжались исследования алгоритмов, что привело к созданию нового прототипа, который пытался уменьшить количество негативных или ложных ответов. ChatGPT, версии 3.5, был запущен в ноябре 2022 года и продемонстрировал улучшенное понимание этики и морали. Он мог предложить более вдумчивые ответы о том, что делать — с учетом законности, чувств и эмоций людей и безопасности всех участников — с четко сформулированными ответами во многих областях знаний. ChatGPT также обладал феноменальными навыками компьютерного кодирования, способного сгенерировать весь макет веб-сайта или подробный сценарий за считанные секунды всего по нескольким запросам пользователя. Однако его фактическая точность оказалась в ряде случаев неравномерной.

GPT-4 появляется в 2023 году, и эксперты по технологиям начали размышлять о том, какими могут быть его возможности. Оценки количества параметров сильно различались — от тех, кто считал, что оно будет таким же или лишь немного больше, чем 175 миллиардов GPT-3, до тех, кто предсказывал еще один огромный скачок, возможно, на сотни триллионов.

В конце концов, GPT-4 оказывается в нижней части этих прогнозов. Однако эффективное масштабирование значительно улучшилось в последние годы, а это означает, что количество параметров само по себе больше не является лучшим показателем производительности языковой модели — схлже с так называемым «мифом о мегагерцах» 2000-х годов, который применялся к скоростям персональных компьютеров. Вместо этого обучение на больших наборах данных теперь более важно.

GPT-4 представляет собой самую впечатляющую языковую модель из когда-либо созданных — она прошла несколько модифицированных версий теста Тьюринга и вызвала широкие общественные дебаты по поводу потенциала искусственного интеллекта в ближайшем будущем. Он имеет большую скорость, более длинное контекстное окно, лучшую точность фактов и улучшенную способность «запоминать» и ссылаться на информацию из предыдущих разговоров. В нем также дополнительно рассматриваются этические проблемы, связанные с более ранними версиями.

Благодаря постоянному повышению эффективности и снижению стоимости оборудования GPT-4 и его производные начинают распространяться в таких приложениях, как обслуживание клиентов и техническая поддержка. Пятое и шестое поколения языковых моделей будут разработаны во второй половине 2020-х годов, что приведёт к созданию действительно человекоподобного ИИ, способного имитировать реального человека почти в 100% случаев.

More…

2023

Переломная точка во взаимодействии человека и ИИ

К этому времени искусственный интеллект (ИИ) достигает такого уровня развития, который начинает коренным образом изменять человеческое общество и культуру. В этом году отмечается дата так называемой технологической сингулярности, постулируемой футуристом Рэем Курцвейлом. Хотя Курцвейл был склонен к чрезмерному оптимизму в ряде конкретных прогнозов на будущее, его основная предпосылка экспоненциального роста технологий оказалась точной. Технологическое развитие начинает становиться в принципе неуправляемым и необратимым, что порождает радикальные изменения характера человеческой цивилизации.

Спекуляций в это время предостаточно, похожих на боязнь “ошибки 2000” в 1999 году или предсказаний о конце света из-за календаря майя в 2012 году и прочих подобных событий в другие даты. Интернет кишит слухами и мемами, связанными с сингулярностью. В то время как большая часть этих разговоров является необоснованной шумихой – при том, что жизнь для большинства людей протекает нормально, – “нормальный” один год меняется с такой скоростью, которая показалась бы пугающе быстрой наблюдателям из предыдущих десятилетий. Технологические скачки с 2020 по 2045 год были гораздо более заметными, чем за тот же промежуток времени с 1995 по 2020 год. Прогресс, который ожидается в следующие 15 лет, покажется ещё более значительным.

Роботы, например, в настоящее время широко распространены в повседневности, их число увеличилось на порядки за предыдущие десятилетия. Они встречаются на заводах, фермах и в промышленности, устраняя большую часть традиционной ручной работы людей. Кроме того, эти машины стали заметны в большем количестве в общественных местах, придавая футуристический вид многим городам, поселкам и пригородам. Подобно тому, как примерно 40 лет назад смартфоны с сенсорным экраном перешли из научной фантастики в реальность , эти роботы быстро становятся привычной частью жизни. Это включает в себя полностью автоматизированный сбор мусора на улицах и в парках, роботов-уборщиков в офисах и гостиницах, роботов-охранников, роботов для доставки продуктов и других товаров. Их прототипы начали появляться в 2010-х годах. После экспоненциального роста они станут обычным явлением к 2045 году. Кроме того, начинают появляться двуногие гуманоидо-подобные роботы, которые чаще встречаются в помещениях.

Благодаря увеличению вычислительной мощности в десять тысяч раз по сравнению с 25 годами ранее, роботы в 2045 году могут выполнять множество задач независимо и без надзора человека.

Много лет назад достижения в области глубокого обучения и обработки естественного языка позволили создавать фрагменты текста, неотличимые от текста, написанного человеком, что привело к тому, что чат-боты прошли тест Тьюринга, что стало важной вехой в этой области. Наряду с обработкой естественного языка, ИИ получил возможность осваивать среду реального мира и всё более разнообразный спектр 3D-объектов. Если раньше роботы ограничивались “фиксированными” движениями, то новое поколение обладает большей динамичностью и гибкостью – приспосабливается к новым ситуациям и решает всё больше и больше задач. Эти возможности получили поддержку благодаря беспроводной связи 5G, а затем 6G и экспоненциально растущему объёму данных, собираемых с датчиков, что позволяет роботам учиться на своем опыте и распространять знания друг другу.

В прошлом ограниченная вычислительная мощность означала, что роботы часто тратили минуты на идентификацию объекта или ситуации и необходимого взаимодействия. Однако к 2045 году эти вычисления возможно выполнять почти в режиме реального времени, что позволяет получить гораздо более похожий на человеческий ответ. Хотя остаётся несколько технологических препятствий, всё идёт к тому, что вскоре будет создан так называемый сильный искусственный интеллект (Artificial General Intelligence, AGI).

В дополнение к своим когнитивным способностям некоторые из новейших роботов приобретают чрезвычайно реалистичную внешность. Самые продвинутые модели сейчас пересекают эффект “зловещей долины”, с лицами и телами, которые выглядят почти – но не совсем – как настоящий человек. Это странное и тревожное явление подпитывает спрос на более естественные выражения лица и движения конечностей. Проблема решается с помощью обратной связи с пользователем (роботы могут автоматически определять эмоциональную реакцию человека – хорошую или плохую) в сочетании с такими методами, как захват движения, в процессе, который несколько похож на генеративные состязательные сети. Эти тонкие итерации данных используются для определения “наилучшего” внешнего вида и движения, позволяя постепенно оптимизировать последующие поколения машин. Напечатанные 3D кости, составляющие все 206 в анатомии человека, наряду с новыми материалами, разработанными для более гибкой кожи и мышц, а также более реалистичными глазами и зубами, помогают решить оставшиеся проблемы.

Эти передовые прототипы пока не попадаются обычным представителям общественности, в основном они ограничены государственными, корпоративными и исследовательскими учреждениями, семьями богатых и знаменитых, выступлениями TED и так далее. Однако, менее продвинутые модели в настоящее время относительно распространены в развитых странах. Они популярны среди людей с доходом выше среднего и сопоставимы по стоимости со вторым автомобилем или аналогичной крупной покупкой. В их обязанности входит выполнение домашних обязанностей, таких как уборка, приготовление пищи, а также уход за детьми и пожилыми членами семьи.

Хотя обычно эти андроиды находятся в ограниченной геозоне в пределах собственности владельца и/или местного района, их также можно увидеть и вне её. Они служат отличными партнерами для тренировок на спортивных площадках, беговых дорожках, в парках и других местах отдыха. Будучи способным воспроизводить движения, можно, например, сыграть против чемпиона по теннису или сразиться с известным боксером. При правильном захвате движения владелец может даже играть против собственной версии, если пожелает.

Андроиды появились в секс-индустрии несколькими десятилетиями ранее, хотя и в зачаточных формах с ограниченной функциональностью. Секс-роботы 2045 года несравнимо более сложные и привлекательные, вплоть до того, что многие клиенты (в основном мужчины) формируют долгосрочные отношения с машинами. Браки между людьми и роботами станут легализованы в некоторых юрисдикциях во второй половине этого десятилетия.

Существует множество моральных, этических, правовых, экономических и философских проблем, связанных с распространением роботов в обществе, – все они способствуют растущему ощущению “шока будущего” в это время.

Другие эффекты, подобные сингулярности, появляются до конца десятилетия. Всё более быстрый прогресс интерфейсов мозг-компьютер, обеспечивающий более глубокую интеграцию искусственного интеллекта и человеческого интеллекта, выходящую за рамки медицины и используемую потребителями, такими как игры и виртуальная реальность, а также образование. Индивидуальные технологии в целом становятся изысканно компактными и миниатюрными – например, бионические глаза приближаются к человеческому уровню остроты зрения, а однокристальные устройства теперь приближаются к размеру отдельных клеток крови. Между тем, возможность продлить свою жизнь представляется реалистичной перспективой благодаря недавним успехам в испытаниях по омоложению человека.

Быстрый рост искусственного интеллекта и робототехники, наряду со многими другими ошеломительными технологиями, происходит во время геополитических потрясений, когда мир сталкивается с конвергенцией социальных, экономических и экологических проблем, подобных которым никогда раньше не было. Эта нестабильность и сам темп изменений создают “размытость сознания” для многих людей в эти годы – ощущение, что человечество достигает поворотного момента в истории.

More…

2047

Первый в мире киборг

В 2002 году профессор кибернетики Кевин Уорвик из Университета Рединга, Великобритания, совершил крупный прорыв в области интерфейсов мозг-компьютер (BCI). Этот знаменательный проект состоял из двух экспериментов, оба из которых были проведены самим профессором Уорвиком.

Первый включал в себя массив из 100 электродов, имплантированных в его руку. Они могли напрямую подключаться к его центральной нервной системе и посылать электрический сигнал за пределы его тела. Используя этот метод, профессор Уорвик успешно манипулировал роботизированной рукой, не используя ничего, кроме нервных импульсов. Дальнейшие эксперименты включали дистанционное управление через Интернет, а также управление инвалидной коляской с электроприводом.

Вторым этапом проекта была прямая искусственная связь между двумя людьми. Это тоже было успешно продемонстрировано. Используя Интернет в качестве посредника, между ним и его женой были отправлены сигналы. Хотя эффекты были незначительными, это был первый случай, когда нервные сигналы были искусственно посланы между двумя людьми. После эксперимента было доказано, что интерфейсы оставляют минимальное повреждение тканей.

More…

2002

Прорыв в области компьютерной графики лица

В 2008 году новая технология моделирования была впервые разработана калифорнийской компанией Image Metrics, позволяющей фиксировать и воссоздавать мельчайшие детали выражения лица. Преодоление барьера, известного как “зловещая долина” – явление, основанное на гипотезе, подразумевающей, что робот или другой искусственный объект, выглядящий или действующий примерно как человек (но не точно так, как настоящий), вызывает неприязнь и отвращение у людей-наблюдателей, – теперь можно рассматривать как реальную возможность. Пример этой технологии продемонстрирован в видео, на котором показана полностью созданная компьютером женщина по имени “Эмили”. С дальнейшим прогрессом грань между тем, что кажется реальным, и тем, что просто визуализируется, полностью стирается к 2020 году.

2008

Ученые извлекают изображения непосредственно из мозга

В результате крупного научного прорыва японская компания разработала способ анализа электрических сигналов, посылаемых зрительной корой головного мозга, и преобразования их в цифровые изображения на экране. В одном из экспериментов испытуемым показывали шесть букв в слове “нейрон”. Компьютер успешно восстановил слово на экране, измерив активность их мозга.

More…

2008

Роботизированное манипулирование нежесткими объектами

Роботизированное манипулирование нежесткими объектами, конфигурация которых заранее неизвестна, стало возможным в 2010 году. Робот, разработанный в Калифорнийском университете, был продемонстрирован, анализируя полотенца “на лету”, а не получая фиксированный набор движений. Он может сканировать различные формы, цвета и материалы с помощью пары камер высокого разрешения, затем складывать и раскладывать их в аккуратные стопки.

2010

Симуляция миллиарда моделей человеческого мозга возможна в реальном времени

В конце 20-го – начале 21-го веков наблюдалось значительное увеличение вычислительной мощности и объёма хранения данных. Каждое новое поколение микросхем были меньше по размеру и более энергоэффективны, чем предыдущие, что приводило к более масштабному и сложному применению. Эта тенденция получила название закон Мура, и привела к постепенному появлению искусственного интеллекта в сочетании с моделированием мозга вплоть до уровня отдельных нейронов.

Несмотря на случайные неудачи, экспоненциальный прогресс в вычислительной мощности продолжался в последующие десятилетия, что обусловлено дальнейшими инновациями в миниатюризации компонентов новых системных архитектур, новыми материалами и новыми методами охлаждения. К 2058 году на одной машине можно смоделировать в режиме реального времени на уровне отдельных нейронов до миллиарда человеческих мозгов. Однако, в последние годы был достигнут физический нижний предел размера транзистора, что означает, что компьютеры могут стать более мощными только за счёт увеличения их размера. В это десятилетие произошли глубокие изменения в роли суперкомпьютеров – самых больших и мощных компьютеров – поскольку они, похоже, начинают жить своей собственной жизнью, расширяя свою инфраструктуру и программное обеспечение таким образом, чтобы существенно влиять на местные, региональные и мировые события. Это вызывает серьёзные опасения относительно возможных экзистенциальных рисков и непредвиденных последствий.

До недавнего времени мировая политика и экономика в значительной степени или полностью определялись человеческими мыслями и эмоциями. Однако, становится ясно, что новые формы машинного сверхразума и гибридные слияния человека и искусственного интеллекта начинают изменять культурный дух времени. Компьютеры сейчас настолько мощные, что им делегируются многие задачи высокого уровня в бизнесе и правительстве. Крупномасштабные модели мозга могут использоваться для оценки вероятной реакции всего населения страны на новые идеи, продукты или гипотетические события, или, например, для тестирования новых биотехнологических имплантатов – часто разработанных самими суперкомпьютерами. Хотя действительно точное моделирование мозга, то есть на субатомном уровне, ещё предстоит усовершенствовать, состояния мультибелковых комплексов теперь могут быть включены в модель единого мозга. Другие области применения этих суперкомпьютеров включают меры по комплексной борьбе с изменением климата, эти проблемы, наконец, начинают решаться в течение следующих нескольких десятилетий.

На потребительском уровне игровые устройства теперь обеспечивают невероятно реалистичные впечатления. Полное погружение в виртуальную реальность теперь стало основным явлением, после стремительного развития в течение последних двух десятилетий. Достижения в процедурном поколении привели к созданию «Матричных» миров захватывающего масштаба и изобретательности. В киберпространстве сформировались целые новые общества, в которых многие люди проводят всё своё свободное время. Когда вы сталкиваетесь с игроком или персонажем онлайн, практически невозможно отличить человеческий интеллект от искусственного.

More…

2058

В целях безопасности внедряются интеллектуальные технологии слежения

Спустя двадцать лет после 11 сентября устройства для наблюдения стали обязательным элементом систем безопасности аэропортов, спортивных стадионов и любых мероприятий высокого уровня. Эта технология столкнулась с проблемами с самого начала, поскольку приводила ко множеству ложных тревог – но последние достижения в области неврологии и аналитического компьютерного программного обеспечения значительно повысили точность таких устройств.

Система, основанная на алгоритмах с использованием искусственного интеллекта и распознавания лиц использует многочисленные сенсоры и камеры. Она следит за эмоциональным состоянием человека, выражением лица, жестикуляцией, температурой тела и другими сигналами. Проанализированные в совокупности, эти факторы помогают определить, планирует ли человек совершить преступление. Пионером внедрения таких систем является Китай.

Также активное распространение получают интеллектуальные системы слежения за автомобильным трафиком, распознавания пешеходов на дороге или дтп, различных нарушений правил дорожного движения.

2021

Разработка медицинских нанороботов

Разрабатываются наномасштабные роботы, чьи размеры на порядки меньше размеров ранних микро-версий. Они являются частью программы по улучшению и модернизации системы здравоохранения. В некоторых странах разработка и внедрение этих роботов уже вошли в стадию проведения испытаний на людях и скоро будут одобрены правительством. Они могут быть использованы как для диагностики, так и для лечения. Размер нанороботов позволяет им проникать в ранее недоступные места человеческого тела или же воздействовать на области, которые чересчур восприимчивы для обычных инструментов.

В ближайшие годы самый значимый прорыв произойдет в методах борьбы с раком. С использованием  нанороботов  можно будет обнаружить опухоль на самой ранней стадии, а затем воздействовать на нее с большой точностью. Даже излечение пациентов, которым раньше могли бы поставить диагноз «неизлечимо больной», становится обычным делом. Резко улучшаются возможности диагностики болезней сердца, неврологических расстройств и многих других заболеваний. В сочетании с выдающимися успехами в исследовании стволовых клеток это позволит создать следующее поколение медицинских препаратов с совершенно новым уровнем эффективности.

Нанороботы создаются методом молекулярного наслаивания с использованием позиционно-контролируемого алмазного механосинтеза и алмазоидных нанофабрик. Каждый робот способен самостоятельно перемещаться, используя крошечный моторчик, а также оснащен микроскопическими сенсорами, системой наведения и системой связи.

2025

Роботизированные руки, соответствующие человеческим

В рамках продолжающегося роста уровня потребительской робототехники новых рубежей достигли последние исследования в области искусственного интеллекта и устройств, созданных по образу и подобию биологических организмов. Современные роботы теперь могут выполнять все более широкий круг задач как дома, так и на работе.  Одно из самых важных (и трудных) умений для таких машин – способность распознавать и взаимодействовать с различными физическими объектами. Для таких простых или повторяющихся задач, как, например, производственная линия сборки, решение было достаточно незамысловатым, требующим просто определенных навыков программирования и использования механических систем. Но все  возрастающая сложность ситуаций, с которыми  приходится сталкиваться коммерческим роботам в настоящее время, привело к разработке более сложных механизмов с широким диапазоном возможностей.

Как уже часто бывало, инженеры обратились за идеями для моделирования как формы, так и функциональных особенностей нового робототехнического аппарата собственно к человеческому телу. Так как почти все роботы должны в некотором роде управлять физическими объектами и взаимодействовать с ними, рука стала наиболее часто имитируемой частью человеческого тела. Вместе с сопутствующим программным обеспечением для визуального распознавания механические руки в 2000-х и 2010-х годах уже могли похвастаться некоторыми впечатляющими способностями. Они могли подбирать миниатюрные и хрупкие объекты, ловить предметы, в них брошенные, делать некоторые жесты,  складывать полотенца, наливать напитки и даже готовить пищу.  Несмотря на это, присущая человеческим рукам уникальная природная ловкость и гибкость наряду с практическими ограничениями механических компонентов мешала ученым добиться идеального воспроизведения.

Однако ко второй половине 2020-х годов используемые технологии получили достаточное развитие для того, чтобы преодолеть большинство препятствий, возникавших в предыдущие десятилетия. Примерно в это же время появляются первые лабораторные образцы  механической руки  с возможностями, равными человеческим.  Достижения в области нанотехнологий, миниатюризации и микроэлектроники позволили инженерам обеспечить выполнение практически всех тонких движений живой биологической руки. Приводы преобразования электроэнергии в движение на основе графена, искусственная кожа, тактильные датчики, гибкая электроника и другие инновации были использованы для полноценной имитации реального объекта. Это также явилось результатом лучшего понимания биомеханики человеческих движений при манипуляциях объектами.

Программы искусственного интеллекта, используя программное обеспечение точного визуального восприятия, способны распознавать бесчисленные физические объекты и разумно планировать, как ими можно манипулировать. Исходя из этого, механическая рука может функционировать автономно и самостоятельно приспосабливаться к различным объектам, основываясь на их текстуре, весе и форме. При этом движения механической руки настолько плавны и естественны, что практически неотличимы от движений реальной человеческой руки. Конечно, пока такие системы еще находятся на стадии испытаний, но в будущем они будут чрезвычайно полезны для создания человекоподобных роботов и андроидов. К середине этого века изощренные возможности механических рук позволят машинам взаимодействовать с людьми и окружающей их средой бесчисленным количеством новых способов.

More…

2026