Следуйте за постоянной публикацией Lifehacker о событиях WWDC 2024.
Яблоко наконец готово для своего момента искусственного интеллекта, после многих лет спекуляций и четырех поколений устройств с почти неиспользованными нейронными двигателями внутри. На своей конференции WWDC 2024 года компания официально объявила о выпуске Apple Intelligence (да, с игрой слов), который выйдет в бета-версии для iPhone, iPad и Mac этой осенью.
Будет интересно посмотреть, как Apple взаимодействует с такой молодой технологией. Как и с Apple Vision Pro, компания обычно предпочитает ждать трендов, пока не сможет выпустить усовершенствованную, в значительной степени безупречную версию. В то же время, искусственный интеллект часто «ошибается», как узнал Google с функцией AI Overviews в начале этого месяца.
Тем не менее, Apple продолжает активно внедрять искусственный интеллект в сообщения, почту, уведомления, написание, изображения и, возможно, самое интересное — в Сири. Компания обещает сохранить свою репутацию за отличное качество, уделяя больше внимания приватности и обработке данных на устройстве, чем конкуренты.
Подробности о том, как именно работает искусственный интеллект Apple, пока неизвестны, но в целом компания обещает сделать больше, чем Google, Rabbit или практически любой другой конкурент до сих пор сделал. Давайте разберемся.
Искусственный интеллект в Сири
Кредит: Apple
Возможно, самой новаторской функцией Apple Intelligence является Сири, которая получает полный ремонт вместе с новым логотипом.
Это момент, который долго ждал: С тех пор, как Siri познакомила мир с цифровым помощником в 2011 году, она была обогнана конкурентами, такими как Google Assistant и Alexa, во многих других аспектах. Теперь Apple удваивает усилия по развитию Siri, полностью перерабатывая ее с помощью искусственного интеллекта, в то время как Google приближается к замене Google Assistant на Gemini. Результат? Гораздо более естественный помощник по искусственному интеллекту, чем на Android.
Прямо сейчас, на устройствах с операционной системой Android, замена Ассистента на Джемини просто перенаправит вас на ярлык веб-приложения. В отличие от своего «глупого» предшественника, Джемини не может устанавливать напоминания, настраивать настройки телефона или открывать приложения, что означает, что его обещания о большей функциональности на самом деле приходят с меньшей функциональностью.
Это не должно быть так с новой Сири, которая сохранит все свои «глупые» функции, но будет обладать новым контекстным пониманием. Теперь, когда вы открываете Сири, она будет смотреть на то, что отображается на вашем экране, и сможет предложить советы на основе этого. Например, вы можете просматривать страницу Википедии о горе Рашмор, и спросить: «Какая погода здесь?» чтобы Сири сообщила вам прогноз погоды для вашей поездки.
Контекстуальное понимание не ограничивается только тем, что вы открыли в данный момент. Apple говорит, что Siri также сможет искать ваши библиотеки и приложения, чтобы выполнять «сотни новых действий», даже в сторонних программах. Скажем, вы сохраните эту статью в свой список для чтения прямо сейчас. Когда Apple Intelligence появится на вашем iPhone, вы сможете попросить Siri «Показать статью Lifehacker о WWDC из моего списка для чтения», чтобы снова получить к ней доступ.
Кредит: Эппл
Или, более лично, представьте, что вы отправляете сообщение другу о подкасте. С новой Сири вы можете просто спросить: «Включи тот подкаст, который Дейв рекомендовал на выходных», и Сири поймет, о чем вы говорите и откроет его.
Здесь имеются серьезные последствия, как для полезности, так и для конфиденциальности. В целом, обещанные контекстные функции включают:
Контекстные ответы на вопросы
Контекстный поиск в фотографиях и видео (например, вы можете попросить Сири показать все фотографии вас в красной рубашке).
Возможность выполнять контекстные действия для вас, такие как добавление адреса на экране к контактной карте или автоматическое улучшение фотографий для вас.
Но Сири также надеется привести гениального сотрудника Apple к вам домой, так как Сири поставляется с предустановленными учебными материалами о том, как использовать ваш iPhone, iPad или Mac. Просто спросите помощника: «Как включить темный режим» или «Как запланировать электронное письмо», и Сири обратится к своим учебным материалам и предоставит вам ответ через уведомление на экране, вместо того, чтобы отправлять вас на страницу справки. (Мы всё ещё будем здесь для всех ваших потребностей в технических советах.)
Кредит: Эппл
Одна из более традиционных функций Siri, основанная на подсказках, — это возможность создавать настраиваемые видеомонтажи с помощью искусственного интеллекта. В настоящее время коллажи памяти от Apple автоматически генерируются в фоновом режиме, алгоритмически связывая вместе фотографии, которые операционная система считает связанными, и устанавливая их на фоновую музыку, которую программа считает подходящей. В скором времени вы сможете дать Siri конкретные указания, ссылаясь на контакты, деятельность или место, а также стиль музыки. Siri затем контекстно сгенерирует подходящий монтаж, с музыкой, взятой из Apple Music.
Также есть типичные функции чатбота AI, такие как возможность задавать вопросы. Странно, но Apple не была ясна в том, сможет ли Сири отвечать на вопросы напрямую (по крайней мере, не связанные с устройствами Apple), но у компании есть резервный вариант: через Сири вы можете задавать свои вопросы ChatGPT.
Поскольку настройки конфиденциальности Apple отличаются от настроек ChatGPT (об этом позже), Сири будет запрашивать разрешение на использование ChatGPT каждый раз, когда вы будете ее использовать. Затем ассистент задаст ваш вопрос, не требуя аккаунта. Как и DuckDuckGo, Apple также будет скрывать ваш IP-адрес при использовании ChatGPT и обещает, что OpenAI не будет записывать ваши запросы. Подписчики ChatGPT также могут связать свои аккаунты с Сири для доступа к платным функциям, хотя Apple предупреждает, что бесплатные пользователи будут сталкиваться с ограничениями на использование данных.
Функции искусственного интеллекта Siri будут доступны на iPhone, iPad и Mac, и представлять собой более естественного помощника, работающего на базе ИИ, чем подход Google, который начинает с нуля с Gemini. Тем не менее, если кажется, что она все еще ограничена по сравнению с тем, что могут делать другие чат-боты LLM, это потому, что Apple Intelligence гораздо больше, чем Siri.
Яблочный интеллект превосходит Google Pixel.
Большая часть презентации искусственного интеллекта Apple в этом году казалась нацеленной на Pixel, в частности на его «обновления функций» искусственного интеллекта. До сих пор транскрипции и Магический редактор были большими эксклюзивами для Google, но Apple Intelligence наконец дает своему крупнейшему конкуренту шанс в той же области.
Сначала устройства iOS, iPadOS и MacOS получают свои собственные версии Magic Eraser и Live Transcription. В приложении Фото пользователи могут нажать на новую иконку Clean Up, чтобы выделить или коснуться объектов, которые они хотят вырезать из изображения. Фото удалит нежелательный объект, а затем использует генеративный искусственный интеллект для заполнения места, где они были. Это не совсем на уровне Magic Editor, который позволяет перемещать объекты после выбора, но Google теперь точно в курсе.
Кредит: Apple
Также приложение Notes сможет подводить итоги и транскрибировать аудиозаписи для вас, что является благом для журналистов, таких как я. У моих коллег был выбор в пользу Pixel только из-за функции транскрибирования, и теперь я наконец смогу держаться наравне с ними на своем iPhone. И еще лучше — Notes также сможет транскрибировать телефонные звонки в режиме реального времени.
Это действительно представляет собой юридический вопрос, поэтому фактическое использование, вероятно, будет отличаться от штата к штату и от страны к стране, так как законы о записи различаются в зависимости от места нахождения. На данный момент Apple говорит, что приложение Телефон будет предупреждать вас, когда начнется запись.
Но помимо функций, похожих на те, что есть в флагмане Google, Apple также разрабатывает собственные уникальные привлекательные особенности. Здесь компания упрощает управление уведомлениями и почтой.
Особенности здесь — это Приоритетные сообщения и Приоритетные уведомления. С помощью Приоритетных сообщений, искусственный интеллект Apple пытается найти «самые срочные электронные письма» и помещает их вверху вашего почтового ящика. Приоритетные уведомления используют аналогичный подход, но с уведомлениями на экране блокировки от текстовых сообщений и приложений.
Кредит: Эппл
С обоими из них у вас будет возможность получить вариант, в котором ИИ напишет вам краткое содержание письма или уведомления вместо предварительного просмотра его содержимого, что поможет вам быстро просматривать вашу ленту. В Почте вы даже сможете получать краткие описания для всей вашей почты.
Яблоко предлагает это как отличный способ быть в курсе своевременной информации, такой как посадочные талоны. Кроме того, в приложении Mail вы сможете использовать умный ответ, чтобы искусственный интеллект быстро написал ответ для вас на основе контекста вашего электронного письма. Вы также сможете получать сводки по всему разговору, а не только по первому письму.
С этими обновлениями Apple наконец приходит за программным обеспечением Google, надеясь свергнуть Pixel с позиции «самого умного смартфона». Но эти инновации не без риска. Возьмем, к примеру, режим фокусировки на уменьшение прерываний, который будет использовать искусственный интеллект для показа «только уведомлений, которые могут потребовать немедленного внимания, например, сообщение о раннем заборе из детского сада». Полагаться на Apple Intelligence для того, чтобы показать вам то, что нужно, — значит доверять непроверенной модели, хотя для Apple обнадеживающим является то, что она имеет уверенность выпустить такую функцию при запуске.
Яблоко может помочь вам писать и создавать изображения.
Говоря о риске, пришло время поговорить о основе искусственного интеллекта: генерации изображений и текста.
Даже когда Google говорит людям использовать «приседающие вилки», Apple, по-видимому, достаточно уверена в своих моделях, чтобы доверить им помочь вам быть креативным. Введите Rewrite, Image Playground и Genmoji. По всем совместимым приложениям как от Apple, так и от сторонних разработчиков, они позволят вам создавать контент с использованием как собственных моделей Apple, так и, в некоторых случаях, ChatGPT.
Переписать — это наиболее знакомое из них. Здесь Apple обещает системную помощь искусственного интеллекта с текстом «почти везде», где вы пишете, включая Notes, Safari, Pages и многое другое с помощью SDK для разработчиков. С помощью меню в стиле правого клика на выделенном тексте пользователи смогут дать Apple Intelligence настраиваемый запрос или выбрать из нескольких предварительно выбранных тональностей, и ИИ затем перепишет текст соответственно.
Не хотите, чтобы искусственный интеллект изменял ваш текст? Он также сможет проверить его на наличие ошибок, подытожить его (полезно, если вы читаете, а не пишете), или переформатировать его в таблицу или список.
Это похоже на новую возможность Chrome переписывать текст при щелчке правой кнопкой мыши, но с гораздо большим количеством вариантов и, как предполагается, доступно во многих других приложениях. Оно также более доступно, чем Copilot, который находится в отдельном меню, отделенном от остальной части Windows.
Вы также сможете создавать текст с нуля, хотя Apple будет полагаться на ChatGPT для этого.
Кредит: Эппл
Изображение Playground и Genmoji — это места, где все становится более новаторским. Вместо того, чтобы переходить на конкретный веб-сайт, как Dall-E или Gemini, устройства Apple теперь будут иметь генерацию изображений прямо в операционной системе.
Доступно как отдельное приложение, встроенное в Messages или интегрированное в другие совместимые приложения через SDK, Image Playground выглядит как типичный генератор искусственного интеллекта, но работает на том же контекстном анализе, что и Siri. Например, вы можете дать ему указание, попросить Image Playground включить кого-то из вашего списка контактов и получить искусство с карикатурой этого человека.
Опять же, Apple полагает большую надежду на своего искусственного интеллекта здесь. Допустим, я отправлю кому-то изображение, сделанное с помощью Image Playground, и оно не обязательно показывает их в лучшем свете: Ужас.
Кредит: Apple
Сказано это, кажется, что на опыте могут быть установлены ограждения. Маркетинговый язык Apple довольно неопределенен относительно того, какие здесь пределы, но даже с ярко выделенным окном для ввода, Apple постоянно говорит нам, что нам придется «выбирать из ряда концепций», включая «темы, костюмы, аксессуары и места». Возможно, Apple не позволит пользователям создавать спорные изображения, с чем ранее сталкивались Bing и Meta.
Но допустим, вам не нужно полное изображение с множеством деталей. Apple также представляет Genmoji, которые похожи на AI-наклейки Meta. Здесь вы сможете дать подсказку AI от Apple и получить настраиваемые эмодзи в стиле официальных вариантов Unicode. Опять же, они могут включать карикатурные изображения людей из вашего списка контактов, но, как и эмодзи, их также можно добавлять в сообщения или делиться ими как реакция на сообщение. Опять же, мы не знаем ограничений, которые Apple будет здесь устанавливать.
Кредит: Эппл
Нам придется подождать, пока искусственный интеллект Apple не появится, чтобы по-настоящему увидеть, насколько хорошо они конкурируют с существующими вариантами, но, возможно, самое интересное здесь — это способность естественно генерировать изображения в существующих приложениях. Хотя Apple обещает, что это будет выходить за рамки Notes, один из примеров, показанных компанией, показывал выбор эскиза в Notes и генерацию полноценного произведения искусства на его основе. В другом примере искусственный интеллект просто создавал совершенно новое изображение в Notes на основе окружающего текста.
Это удобство, особенно учитывая то, что искусственный интеллект остается разделенным между десятками сайтов и сервисов, обязательно станет большим преимуществом продажи здесь.
Яблоко обещает частный, на устройстве искусственный интеллект.
Яблоко не совсем открыто говорило о тренировочных материалах для своего искусственного интеллекта, но то, на что компания обратила внимание, это ее приватность.
Недавно ходатайства от Meta и Adobe вызвали беспокойство о доступе искусственного интеллекта к данным пользователей. Apple хочет сразу же развеять любые подобные опасения относительно своего собственного ИИ.
Согласно Apple, любые данные, к которым имеет доступ ее искусственный интеллект, никогда не хранятся и используются только для запросов. Кроме того, Apple делает свой код серверов доступным для «независимых экспертов» для проверки. Но в то же время компания стремится сократить количество обращений к облаку настолько, насколько это возможно.
Введение чипа A17 Pro (представленного в iPhone 15 Pro и Pro Max) и серии чипов M (используемых в iPad и Mac, начиная с 2020 года). Устройства с этими чипами имеют доступ к нейронным двигателям, которые, по словам Apple, позволят им выполнять «множество» запросов на устройстве, без передачи вашей информации с телефона.
Как именно будет обрабатываться разделение между задачами на устройстве и в облаке, пока еще не ясно, но Apple говорит, что Apple Intelligence сама сможет определить, какие запросы ваше устройство сможет обработать самостоятельно, а какие потребуют помощи от серверов, прежде чем она решит, куда их отправить.
Пока это всего лишь обещание, но это будет огромной победой для Apple, учитывая, что конкурирующие функции, такие как Magic Editor и Gemini, все еще требуют постоянного подключения к интернету.
Когда я смогу попробовать Apple Intelligence?
Яблоко не уточнило конкретные даты запуска Apple Intelligence, вместо этого предоставив зрителям два периода, на которые можно рассчитывать.
Сначала компания заявила, что Apple Intelligence будет «доступен для опробования на английском языке в США этим летом», хотя, судя по тому, что она сказала дальше, это, вероятно, будет ограниченная демонстрация.
Это потому, что полная бета-версия Apple Intelligence запланирована на эту осень, что означает, что она, скорее всего, выйдет после полного выпуска iOS 18, iPadOS 18 и macOS 15 через обновление.
Возможно, самый большой препятствием, с которым Apple должна справиться в своей искусственной интеллекте, помимо выполнения обещаний о безопасности и обеспечения того, чтобы ее генерация контента не вызывала недовольства, — это доступность. Хотя обещание о наличии большинства искусственного интеллекта на устройстве замечательно для конфиденциальности и даже для ситуаций, когда подключение к интернету ограничено, у него есть одно но: в анонсе Apple о своем искусственном интеллекте упоминается только о его появлении на iPhone 15 Pro, iPhone 15 Pro Max и iPad или Mac с чипом M1 или более поздней версией. Аналогично, для начала использования Siri и языка устройства необходимо установить американский английский язык.