sejournal.io

Курсор с ИИ: Google переосмысливает 50-летнюю технологию

1778663697691 791553 scaled

Компания Google DeepMind создаёт «умный» курсор для компьютерной мыши на основе технологии Gemini. Цель — изменить подход к управлению, который не обновлялся более 50 лет.

Разработчики хотят, чтобы курсор не просто указывал на объект, но и понимал, почему он важен для пользователя. Сейчас многие ИИ-инструменты работают в отдельном окне, куда нужно вручную переносить данные. Новая система, наоборот, будет встроена прямо в рабочие приложения, не отвлекая пользователя.

Четыре ключевые идеи нового курсора:

1. Сохранение рабочего процесса. ИИ работает во всех программах. Например, можно навести курсор на PDF и попросить сделать краткое содержание, чтобы вставить его в письмо. Или указать на таблицу — и попросить построить диаграмму.

2. «Покажи и расскажи». Вместо сложных текстовых запросов достаточно просто указать на нужный элемент. Курсор сам «увидит» и поймёт контекст — будь то абзац текста, часть изображения или код.

3. Сила слов «это» и «то». Как в обычной жизни, человек может сказать «исправь это» или «перенеси сюда», а ИИ поймёт по жесту и контексту, о чём речь.

4. Взаимодействие через пиксели. ИИ распознаёт, на что именно указывает пользователь, и превращает пиксели в активные объекты. Например, фото с заметками станет интерактивным списком дел, а стоп-кадр из видео — ссылкой на бронирование.

Как это работает на практике?

Google DeepMind уже внедряет эти принципы в браузере Chrome и в новом ноутбуке Googlebook. В Chrome можно просто указать курсором на часть веб-страницы и задать вопрос Gemini. Например, выбрать несколько товаров и попросить их сравнить.

В Googlebook появится функция Magic Pointer, которая позволит управлять Gemini одним движением пальца. Сам Googlebook — это новая категория ноутбуков, объединяющая Android и ChromeOS, созданная специально для работы с ИИ. Устройства оснащены голосовыми командами и функцией «Создать виджет». Gemini может искать информацию в интернете или подключаться к Gmail и «Календарю», создавая единую панель управления.

Первые модели Googlebook выпустят совместно с Acer, ASUS, Dell, HP и Lenovo.

Что такое Gemini Intelligence?

Это набор ИИ-функций для Android. Летом 2026 года они появятся на Samsung Galaxy и Google Pixel, а затем и на других устройствах. Система объединяет мощное «железо» и софт, чтобы решать задачи пользователя заранее, обеспечивая при этом конфиденциальность. Некоторые функции уже работают: например, заказ еды или такси через смартфон. В будущем достаточно будет сфотографировать брошюру тура, и бот найдёт похожие варианты.

В Chrome ИИ-помощник сможет искать, обобщать и сравнивать информацию с разных страниц. А функция Rambler на клавиатуре Gboard поможет надиктовать текст, очистив его от лишних слов и повторов.

Напомним, что в апреле Google уже представила новое семейство открытых ИИ-моделей Gemma 4 для сложных задач.

Google представила рекордную ИИ-модель Gemini 3.1 Pro

1771570193922 3202341 scaled

Компания Google анонсировала обновленную ИИ-модель Gemini 3.1 Pro, которая показала рекордные результаты в специализированных тестах.

Новая модель демонстрирует значительный прогресс в базовых рассуждениях и решении сложных задач. В частности, в тесте ARC-AGI-2 на логическое мышление она набрала 77,1%, что более чем вдвое превышает результат предыдущей версии Gemini 3 Pro.

Gemini 3.1 Pro уже доступна:
* Разработчикам — через Gemini API в Google AI Studio и других инструментах.
* Бизнес-клиентам — на платформах Vertex AI и Gemini Enterprise.
* Широкой аудитории — в приложении Gemini и сервисе NotebookLM.

По словам создателей, модель предназначена для задач, требующих глубокого анализа, таких как объяснение сложных концепций, синтез информации из разных источников или реализация творческих проектов.

Ранее, в феврале, Google также улучшила режим рассуждений Gemini 3 Deep Think для решения научных и инженерных проблем.

Gemini достиг 750 млн пользователей

1770290576915 3540647 scaled

Количество активных пользователей чат-бота Gemini от Google превысило 750 миллионов в месяц. Такие данные следуют из финансового отчета компании за четвертый квартал 2025 года.

Рост сервиса очень быстрый: еще кварталом ранее этот показатель составлял 650 миллионов. Для сравнения, у конкурента Meta AI ежемесячная аудитория равна 500 миллионам пользователей. Однако Gemini все еще отстает от основного соперника, ChatGPT, аудитория которого достигает 810 миллионов.

Эти цифры были обнародованы вскоре после анонса новой флагманской модели Gemini 3, которая показала высокие результаты в тестах. Генеральный директор Google Сундар Пичаи заявил, что внедрение ИИ положительно влияет на рост компании, а постоянные инвестиции позволяют сохранять темпы развития.

Ранее, в сентябре, Google запустила бюджетную подписку Google AI Plus более чем в 40 странах, включая Украину и Молдову. Ожидается, что это привлечет новую аудиторию и ускорит распространение продукта.

Успех Gemini стал одним из ключевых факторов, позволивших материнской компании Alphabet впервые превысить годовую выручку в $400 миллиардов. Компания связывает рост с развитием искусственного интеллекта и планирует агрессивно наращивать инвестиции в эту сферу.

На 2026 год Alphabet запланировала капитальные затраты в размере от $175 до $185 миллиардов. Верхняя граница этой суммы более чем в два раза превышает расходы прошлого года. Такой бюджет значительно превосходит планы других технологических гигантов: Meta планирует потратить от $115 до $135 миллиардов, а Microsoft обещает сокращать расходы после крупных вложений в предыдущем квартале.

Однако Уолл-стрит с настороженностью относится к такой гонке бюджетов, опасаясь перегрева рынка и формирования «пузыря». Некоторые эксперты, включая главу HSBC, предупреждают, что текущие доходы от ИИ могут не оправдать огромных затрат на вычислительные мощности.

Сам Сундар Пичаи также отмечал, что в текущем ажиотаже на рынке ИИ есть признаки «иррациональности» и ни одна компания не застрахована от возможного спада. Напоминанием о рисках служит и утечка документов OpenAI, которая показала, что компания может до сих пор тратить на поддержку своих моделей больше, чем зарабатывает.

Google добавил в Chrome новые ИИ-инструменты Gemini

1769686227480 2350994 scaled

Google внедряет в браузер Chrome новые инструменты на базе искусственного интеллекта Gemini. Основными новшествами стали генератор изображений Nano Banana, функция «Персональный интеллект» и «Автопросмотр».

ИИ-ассистент, который был добавлен в виде плавающего окна в сентябре 2025 года, теперь закреплён на боковой панели. Он позволяет пользователям задавать вопросы о просматриваемом сайте или других открытых вкладках. Также появилась возможность анализировать несколько вкладок как единый контекст. Ранее Gemini в Chrome был доступен только на Windows и macOS, теперь он открыт и для пользователей Chromebook Plus.

Функция «Персональный интеллект», которая использует данные из аккаунтов Gmail, Поиска, YouTube и Google Фото, позволит в ближайшие месяцы задавать чат-боту вопросы, например, о расписании семьи, или составлять черновики писем, не переключаясь на почту.

Инструмент Nano Banana даёт возможность редактировать и изменять изображения, используя в качестве образцов другие картинки из интернета.

«Автопросмотр» — это ИИ-агент, способный самостоятельно выполнять задачи: переходить по ссылкам, совершать покупки или искать скидочные купоны. Он запросит вмешательство пользователя только при необходимости работы с конфиденциальными данными.

Однако ИИ-браузеры несут в себе риски для безопасности. В декабре 2025 года OpenAI сообщила об уязвимостях, таких как «инъекция промпта», и признала, что подобные проблемы вряд ли будут полностью устранены. Компании Anthropic и Google также признают эти риски, делая ставку на многоуровневую защиту.

Параллельно Google представила функцию Agentic Vision для модели Gemini 3 Flash. Она позволяет детально изучать изображения, действуя по принципу «думать, действовать, наблюдать»: ИИ анализирует запрос, составляет план, выполняет действия с изображением (например, кадрирование) и оценивает результат. Это повышает точность распознавания на 5-10%. Бета-версия Agentic Vision уже доступна разработчикам.