Сентябрь 9, 2024

Появившийся несколько лет назад браузер для геймеров Opera GX постепенно прирастает новыми функциями. Помимо включения в функционал известного ChatGPT, в 2023 году там появился новый ИИ-сервис под названием Aria. Сегодня разбираемся в его функционале и выясняем, насколько он отличается от других нейросетей.

Aria — это браузерный ИИ, основанный на языковой модели GPT-3 с собственными доработками компании Opera. На данный момент он имеет чат-бота, с которым можно взаимодействовать путем текстовых запросов, причем сервис довольно хорошо работает с русским языком. Помимо этого, Aria может генерировать изображения по текстовым промптам (запросам) и распознавать их. Также присутствует функционал по генерации различных типов текста.

Для работы в Aria нужно зарегистрировать учетную запись в Opera. Если после этого чат Aria отказывается работать, то нужно перейти в настройки, найти там раздел Early Bird и подключить его. Раздел включает в себя новые браузерные функции, находящиеся в стадии разработки и тестирования. Однако, если и после этого Aria по-прежнему отказывается работать, то для запуска придется прибегнуть к помощи сторонних приложений.

Aria располагается на левой панели инструментов. Для начала работы с ней просто щелкаем по значку, после чего перед нами появится окно. Если планируете пользоваться функцией постоянно, то можно закрепить это окно, нажав на кнопочку в правом верхнем углу.

Если по какой-то причине у вас в браузере не отображается панель слева, то идем в «Настройки» — «Показать боковую панель» и переводим ползунок. Если панель появилась, но в ней нет Aria, то щелкаем по панели правой кнопкой мыши, выбираем «Настройки боковой панели» и отмечаем нужные нам пункты. Те же самые действия можно совершить в настройках, в блоке «Управление боковой панелью». Заходим в ее настройки, ищем «Aria» и ставим напротив галочку.

Здесь вводим любой запрос и ждем ответ. К слову, необязательно вводить все запросы в одной ленте. Отдельный запрос или запросы по одной тематике (например, игры, фильмы, новости) можно объединить в отдельных чатах. Щелкаем здесь и начинаем чат.

Чат-бот и запросы

Все ответы мы можем оценить, озвучить голосом, скопировать или загрузить в Pinboard. Это своего рода хранилище всех текстов, изображений, вопросов и ответов, которые были получены через чат-бота. Сюда же добавляются все открытые вкладки, которые пользователь просматривает в браузере. На данный момент эта фишка находится в стадии бета-тестирования и имеет небольшой набор функций, в которые входит изменение фона и возможность поделиться накопленным материалом с другими пользователями.

После установки Opera GX, на линейке вкладок браузера по умолчанию может находиться окно GX Corner. Если вы часто сохраняете вкладки в Pinboard, то оно всякий раз автоматически также будет сохранятся вместе с другими вкладками, что вызывает определенные неудобства. Чтобы избежать этого, вновь ищем блок «Управление боковой панелью» и включаем функцию «GX Corner на боковой панели».

Чат-бот и картинки

Aria работает по принципу нейросети для генерации изображений. По сравнению с более именитыми аналогами, ее функционал не богат, но тем не менее, она может создавать неплохие изображения по запросам. Запрос вводим прямо в окно чат-бота и ждем некоторое время.

Минус интерфейса Aria в том, что на данный момент его нельзя открыть на весь экран. Но можно немного увеличить, наведя курсор на крайнюю правую границу окна и потянув мышь вправо.

Изображение также, как и текст, можно сохранить, оценить, загрузить в Pinboard. Однако, чтобы получить какие-либо детализированные в тем или иных стилях изображения, все нужно прописывать в промпте.

В целом по несложным запросам нейросеть выдает довольно приятные глазу изображения.

Усложним задачу и попросим Aria нарисовать кота, сидящего на улице в стиле сериала Симпсоны. Первоначально нейросеть не сразу поняла, что от нее хотят и выдала пару котов, которые не особо подходили к нашему запросу.

И только после некоторых попыток, смогла выдать хотя бы что-то более или менее подходящее.

Посмотрим, как бы с этим справились другие нейросети. Если запустить тот же самый запрос в ChatGPT 4 (версия ChatGPT-4o), то он выдает более приближенный к стилю результат, причем с детальным текстовым описанием.

А такой вариант изображения выдала нейросеть Kandinsky.

Сделаем еще несколько сравнений. По простому запросу о рисунке зимней природы Aria, GPT-4 и Kandinsky выдали привлекательные результаты. Причем у Aria и Kandinsky он получился более фотографическим, хотя стоит сделать упор на то, что какие-либо стили мы здесь не задавали.

Aria, Kandinsky, GPT-4

Ну и напоследок ретро-изображение автомобиля на гоночной трассе в сравнении с Kandinsky.

Aria и Kandinsky

Если усложнить задачу, то нейросеть справляется с ней не всегда точно. Либо ей нужно несколько попыток, чтобы добиться более или менее полезного результата. По крайней мере, обработка некоторых изображений дается ей с трудом. Некоторые запросы нейросеть порой отказывается обрабатывать, ссылаясь на нарушение правил использования. Например, так получилось с просьбой нарисовать картинку рыцаря в средневековых доспехах, вооруженного длинным мечом. После корректировки запроса, сеть все же обработала его, но, тем не менее, не совсем идеально.

Распознавание изображений

Функция, позволяющая расспросить ИИ о том, что изображено на картинке. Алгоритм здесь прост. Загружаем иллюстрацию и задаем какой-либо вопрос. В нашем примере мы просим узнать, что изображено на картинке и получаем ответ. Здесь же мы можем попробовать сгенерировать с этим изображением какие-либо картинки. Нейросеть при этом откликается, но тем не менее допускает серьезные ошибки.

Сравним эту фишку с ChatGPT-4. В принципе результат не особо отличается, кроме того, что GPT-4 дополнительно подробно описывает все, что изображено на картинке.

После старта GPT-4, пользователи «подшучивали» над ним, предлагая объяснить, что он находит забавного в этом изображении.

Попробуем и мы «подшутить» над Aria, используя данное изображение и задав ей аналогичный вопрос. В целом нейросеть поняла, что с картинкой не так, но детального описания не выдала. GPT-4 c этой задачей справился намного лучше, рассказав, в чем здесь ошибка, и разгадав шутку.

А вот в следующем изображении получились любопытные отличия. Перед нами известная фотография, показывающая чистоту воды в Швеции и иллюзию того, что рука лежит на камнях, хотя на самом деле она под водой. Не будем судить насколько фото реально, спросим об этом у нейросетей. Aria на вопрос, в чем ошибка на фото, указывает, что ошибки нет.

А ChatGPT верно подобрался к правильному ответу и указал на несколько возможных вариантов того, что может быть с водой на фото.

Используем контекст страницы

Чат-бот не обязательно вызывать кликом мышки по боковой панели. Достаточно при просмотре страниц в браузер нажать комбинацию Ctrl+Shift+7 и в появившемся окне ввести интересующий запрос. Если нужно, то дальнейшую работу можно продолжить уже в чат-боте.

В этом же окне есть еще одна любопытная функция — использование контекста просматриваемой страницы. Так, например, когда пользователь просматривает ту или иную страницу в интернете, он, нажав на Tab в окне, может задать интересующие его вопросы.

Нейросеть соберет ответы на основе имеющейся на странице информации и выдаст тот или иной ответ. Текстовые ответы она, как правило, выдает более правильные. А вот если опросить ИИ нарисовать изображение на основе имеющейся на странице информации (да, можно сделать и так), то результат будет довольно своеобразным.

Хотя сама по себе эта фишка довольно любопытная. Неплохим вариантом ее применения могло бы стать создание картинок для иллюстрации читаемой книги. Однако пока нейросеть с этим справляется довольно тяжело.

Highlight Tooltip

Функция пришла прямо из классического браузера Opera. Пользователь выделяет текст и в появившемся контекстном меню выбирает что нужно сделать с выделением: перевести или исследовать тему. К слову, в Opera Aria можно было к этим командам прибавить еще и просьбу кратко объяснить выделенное.

Выглядит это таким образом. Выделяем нужный текст и нажимаем «Исследуйте больше». ИИ выдает нам результат, найденный в сети.

Работаем с запросами и текстом

Собственно, мы подошли к самому большому блоку возможностей Aria по работе с текстом. В этом плане Aria похожа на ChatGPT. Как уже упоминалось выше, она и работает с помощью модели GPT-3,5, хотя и с внесением своих изменений.

Итак, переходим к текстовому блоку ИИ. Чтобы попасть туда в окне чат-бота нажимаем три точки, а затем — кнопку «Создать». Если видим ошибку, то пробуем заново или перезагружаем браузер.

Видим, что можно выбрать несколько задач: «Дебаты», «Электронная почта», «Эссе» и другие. Всего можно выбрать девять разных задач. К каждой из них дополнительно выбираем тональность (или стиль) из таких вариантов, как «Формальный», «Неформальный», «Смешной» и другие. Также можно задать длину текста: «Короткий», «Средний», «Длинный».

Еще одной полезной фишкой может стать функция «Мой стиль». Благодаря ей пользователь может научить нейросеть составлять тексты в стиле близком к его собственному. Для этого нужно войти в пункт и выполнить задания, заполнив пустые поля текстом.

Практикуем и сравниваем

Сравнивать будем с тем же GPT-4 (версия ChatGPT-4o).

Для начала это будет попросим ИИ составить небольшой рассказ про космонавтов на Марсе в юмористическом стиле. Обе нейросети справляются с текстом, хотя он получился довольно бедным на стилистические обороты и немного безликим. Попробуем добавить в промпт больше деталей.

Это определенное количество героев (четыре космонавта), конфликт (нехватка воды), антагонисты (пусть будут неизвестные земной науке существа) и тональность (напряженный, но с легким юмором).

Идеального рассказа не выдала ни одна из нейросетей, хотя вариант, созданный в GPT-4, получился более логично выстроенный и удачный. Aria в этом плане несколько отстает, выводя довольно упрощенный текст. А в одной из попыток из рассказа пропали диалоги.

Продолжим эксперименты, но теперь отойдем от рассказов и составим дискуссию. Здесь в окне поиска задаем конкретную тему и смотрим на результат. В принципе довольно неплохо, по крайней мере пункты можно использовать в работе. В тоже время у GPT получилось намного лучше в плане наполнения дискуссии фактическим материалом и самой структурой.

В случае с викториной можно в окне запросов вписать тему викторины или же все необходимые термины. ИИ должна самостоятельно подобрать нужные вопросы и ответы. В целом все ИИ справились с заданием, однако ChatGPT-4 ожидаемо выдала более качественный результат. Ее вопросы точнее и дают больший охват темы, нежели чем в варианте с Aria.

Еще одна фишка — создание плана презентации. Указываем в запросе тему и ждем ответ. Можно сказать, что обе сети с задачей справились, хотя структура презентации у той и другой ИИ отличается друг от друга. Так в ChatGPT-4 чаще всего только описывает тему того или иного слайда и задает общее направление, которое пользователю нужно найти и самостоятельно. В Aria же предлагается конкретный вариант наполнения текстом того или иного слайда.

Еще одно, причем весомое отличие, заключается в том, что в запросе можно указать, что пользователю нужна презентация с изображениями. В этом случае ChatGPT-4 укажет, какое изображение желательно поместить на слайд (график, картинка и т.п.). Aria этого делать пока не умеет.

Что еще? По такому же сценарию можно подготовить речь, статью, пост в соцсети или письмо для электронной почты. Последний вариант может пригодиться при составлении резюме.

Решение задач, уравнений

В целом эта фишка нейросетей уже известна, причем на просторах сети можно найти немало приложений для решений даже самых трудных задач. В целом, как и GTP-4, Aria с заданием справляется, причем каждая из сетей выдает подробное решение.

Немного выводов

В целом Aria работает и выполняет все популярные функции современных нейросетей. В тоже время, пытаясь объединить в себе функционал сетей для работы с текстом и изображениями, она пока еще не дотягивает до популярных в этой сфере нейросеток. Пользователей, которые плотно работают с ChatGPT и другими сетями, базирующимися на модели GPT, она навряд ли заинтересует. То же самое касается и работающих с топовыми и раскрученными сетями для генерации изображения. Но тем не менее, стоит учитывать, что Aria в первую очередь нацелена на тех, кто активно пользуется браузерами Opera. Кроме того, нейросеть находится в процессе разработки, поэтому ее функционал в будущем явно будет пополняться и шлифоваться.

Комментарии

Сообщения не найдены

Написать отзыв