Тема генеративного ИИ часто всплывает в моем информационном бюллетене Actuator. Признаюсь, несколько месяцев назад я немного сомневался, стоит ли уделять этому вопросу больше времени. Любой, кто пишет о технологиях так долго, как я, пережил бесчисленные циклы шумихи и уже обжигался раньше. Репортаж о технологиях требует здоровой дозы скептицизма, надеюсь, умеренного некоторым волнением по поводу того, что можно сделать. На этот раз казалось, что генеративный ИИ ждет своего часа, выжидая своего часа, ожидая неизбежного кратера криптографии. По мере того, как из этой категории уходила кровь, такие проекты, как ChatGPT и DALL-E, оставались в стороне, готовые стать центром захватывающих дух репортажей, надежды, критики, обреченности и всех различных стадий технологического ажиотажа Кюблера-Росси. Те, кто следит за моими материалами, знают, что я никогда не был особенно оптимистичен в отношении криптовалют. Однако с генеративным ИИ все иначе. Начнем с того, что существует почти всеобщее согласие в том, что искусственный интеллект / машинное обучение в широком смысле будут играть более централизованную роль в нашей жизни в будущем.
Amazon и MIT сотрудничают, чтобы изучить, как роботы влияют на рабочие места
Смартфоны дают здесь отличное представление. Компьютерная фотография - это то, о чем я пишу довольно регулярно. В последние годы в этой области были достигнуты большие успехи, и я думаю, что многие производители наконец-то нашли хороший баланс между аппаратным и программным обеспечением, когда дело доходит как до улучшения конечного продукта, так и до снижения планки входа. Google, например, демонстрирует несколько действительно впечатляющих трюков с такими функциями редактирования, как Best Take и Magic Eraser. Конечно, это изящные трюки, но они также полезны, а не являются функциями ради функций. Однако в дальнейшем настоящий фокус будет заключаться в их плавной интеграции в опыт. При идеальных рабочих процессах будущего большинство пользователей практически не будут иметь представления о том, что происходит за кулисами. Они будут просто счастливы, что это работает. Это классическая книга Apple playbook.
Генеративный ИИ предлагает аналогичный эффект “вау” сразу, что является еще одним отличием от его предшественника из цикла шумихи. Когда ваш наименее технически подкованный родственник может сесть за компьютер, ввести несколько слов в поле диалога, а затем наблюдать, как черный ящик выплевывает рисунки и короткие рассказы, особой концептуализации не требуется. Это во многом причина, по которой все это стало известно так быстро — в большинстве случаев, когда обычные люди знакомятся с передовыми технологиями, им требуется представить, как это может выглядеть через пять или 10 лет. С помощью ChatGPT, DALL-E и др. Вы можете испытать это на собственном опыте прямо сейчас. Конечно, оборотной стороной этого является то, насколько сложно становится умерять ожидания. Несмотря на то, что люди склонны наделять роботов интеллектом человека или животного, без фундаментального понимания ИИ здесь легко проецировать интенциональность. Но именно так обстоят дела сейчас. Мы публикуем заголовок, привлекающий внимание, и надеемся, что люди задержатся достаточно надолго, чтобы прочитать о махинациях, стоящих за этим.
Одно из приятных преимуществ моей работы - возможность обсуждать эти вещи с людьми намного умнее меня. Они тратят время на объяснения, и, надеюсь, я хорошо перевожу это для читателей (некоторые попытки более успешны, чем другие). Как только стало ясно, что генеративный ИИ призван сыграть важную роль в будущем робототехники, я начал находить способы вставлять вопросы в разговоры. Я нахожу, что большинство специалистов в этой области согласны с утверждением, приведенным в предыдущем предложении, и удивительно видеть широту влияния, которое, по их мнению, это окажет.
Например, в моем недавнем разговоре с Марком Райбертом и Джилл Пратт последний объяснил, какую роль генеративный ИИ играет в своем подходе к обучению роботов: Мы выяснили, как что-то сделать, а именно использовать современные методы генеративного ИИ, которые позволяют человеку демонстрировать как позу, так и силу, по сути, обучая робота всего на нескольких примерах. Код не изменился вообще. В основе этого лежит так называемая политика распространения. Это работа, которую мы проделали в сотрудничестве с Колумбией и Массачусетским технологическим институтом. На данный момент мы обучили 60 различным навыкам. На прошлой неделе, когда я спросил вице-президента и генерального директора Nvidia по встраиваемым и периферийным вычислениям Дипу Таллу, почему компания считает, что генеративный ИИ - это больше, чем дань моде, он сказал мне:
Я думаю, это отражается на результатах. Вы уже видите улучшение производительности. Он может составить для меня электронное письмо. Это не совсем правильно, но мне не обязательно начинать с нуля. Это дает мне 70%. Есть очевидные вещи, которые вы уже можете видеть, и которые определенно работают на шаг лучше, чем то, как все было раньше. Подводя итог, можно сказать, что что-то не идеально. Я не собираюсь позволять этому читать и обобщать за меня. Итак, вы уже можете видеть некоторые признаки улучшения производительности.
Между тем, во время моего последнего разговора с Даниэлой Рус глава MIT CSAIL объяснила, как исследователи используют генеративный ИИ для реального проектирования роботов:
Оказывается, генеративный ИИ может быть достаточно мощным даже для решения задач планирования движения. Вы можете получать гораздо более быстрые решения и гораздо более гибкие и гуманистичные решения для управления, чем с решениями, основанными на модели прогнозирования. Я думаю, это очень мощно, потому что роботы будущего будут гораздо менее роботизированными. Их движения будут гораздо более плавными и похожими на человеческие.
Мы также использовали генеративный ИИ для проектирования. Это очень мощный метод. Это также очень интересно, потому что это не просто генерация шаблонов для роботов. Вы должны делать что-то еще. Это не может быть просто генерация шаблона на основе данных. Машины должны иметь смысл в контексте физики и физического мира. По этой причине мы подключаем их к движку моделирования, основанному на физике, чтобы убедиться, что проекты соответствуют требуемым ограничениям. На этой неделе команда Северо-Западного университета представила собственное исследование дизайна роботов, созданных искусственным интеллектом. Исследователи продемонстрировали, как они разработали “успешно шагающего робота за считанные секунды”. Смотреть на это не так уж много, но достаточно легко увидеть, как при дополнительных исследованиях этот подход можно было бы использовать для создания более сложных систем.
“Мы обнаружили очень быстрый алгоритм проектирования, основанный на ИИ, который позволяет обойти пробки эволюции, не прибегая к предвзятости людей-дизайнеров”, - сказал руководитель исследования Сэм Кригман. “Мы сказали ИИ, что хотим робота, который мог бы ходить по суше. Затем мы просто нажали кнопку и вуаля! В мгновение ока был создан план робота, который не похож ни на одно животное, когда-либо ходившее по земле. Я называю этот процесс ‘мгновенной эволюцией ”. "
Это был выбор программы искусственного интеллекта - поставить ноги маленькому мягкому роботу. “Это интересно, потому что мы не говорили ИИ, что у робота должны быть ноги”, - добавил Кригман. “Мы заново открыли, что ноги - это хороший способ передвижения по суше. Локомоция с помощью ног, по сути, является наиболее эффективной формой передвижения по земле”.
“С моей точки зрения, генеративный ИИ и физическая автоматизация / робототехника - это то, что изменит все, что мы знаем о жизни на Земле”, - сказал мне на этой неделе основатель и генеральный директор Formant Джефф Линнелл. “Я думаю, мы все привыкли к тому факту, что ИИ - это нечто, и ожидаем, что это повлияет на каждую нашу работу, каждую компанию и студента. Я думаю, что это симбиоз с робототехникой. Вам не придется программировать робота. Вы поговорите с роботом по-английски, запросите действие, а затем оно будет выполнено. На это уйдет минута ”.
До прихода в Formant Линнелл основал компанию Bot & Dolly и занимал должность генерального директора. Компания из Сан-Франциско, наиболее известная своими работами в области гравитации, была ограблена Google в 2013 году, когда софтверный гигант нацелился на ускорение развития отрасли (продуманные планы и т.д.). Исполнительный директор говорит мне, что его главный вывод из этого опыта заключается в том, что все дело в программном обеспечении (учитывая, что DeepMind постепенно внедряет встроенных и повседневных роботов, я склонен сказать, что Google согласен с этим).
Количество просмотров: 631