sejournal.io

Курсор с ИИ: Google переосмысливает 50-летнюю технологию

Компания Google DeepMind создаёт «умный» курсор для компьютерной мыши на основе технологии Gemini. Цель — изменить подход к управлению, который не обновлялся более 50 лет.

Разработчики хотят, чтобы курсор не просто указывал на объект, но и понимал, почему он важен для пользователя. Сейчас многие ИИ-инструменты работают в отдельном окне, куда нужно вручную переносить данные. Новая система, наоборот, будет встроена прямо в рабочие приложения, не отвлекая пользователя.

Четыре ключевые идеи нового курсора:

1. Сохранение рабочего процесса. ИИ работает во всех программах. Например, можно навести курсор на PDF и попросить сделать краткое содержание, чтобы вставить его в письмо. Или указать на таблицу — и попросить построить диаграмму.

2. «Покажи и расскажи». Вместо сложных текстовых запросов достаточно просто указать на нужный элемент. Курсор сам «увидит» и поймёт контекст — будь то абзац текста, часть изображения или код.

3. Сила слов «это» и «то». Как в обычной жизни, человек может сказать «исправь это» или «перенеси сюда», а ИИ поймёт по жесту и контексту, о чём речь.

4. Взаимодействие через пиксели. ИИ распознаёт, на что именно указывает пользователь, и превращает пиксели в активные объекты. Например, фото с заметками станет интерактивным списком дел, а стоп-кадр из видео — ссылкой на бронирование.

Как это работает на практике?

Google DeepMind уже внедряет эти принципы в браузере Chrome и в новом ноутбуке Googlebook. В Chrome можно просто указать курсором на часть веб-страницы и задать вопрос Gemini. Например, выбрать несколько товаров и попросить их сравнить.

В Googlebook появится функция Magic Pointer, которая позволит управлять Gemini одним движением пальца. Сам Googlebook — это новая категория ноутбуков, объединяющая Android и ChromeOS, созданная специально для работы с ИИ. Устройства оснащены голосовыми командами и функцией «Создать виджет». Gemini может искать информацию в интернете или подключаться к Gmail и «Календарю», создавая единую панель управления.

Первые модели Googlebook выпустят совместно с Acer, ASUS, Dell, HP и Lenovo.

Что такое Gemini Intelligence?

Это набор ИИ-функций для Android. Летом 2026 года они появятся на Samsung Galaxy и Google Pixel, а затем и на других устройствах. Система объединяет мощное «железо» и софт, чтобы решать задачи пользователя заранее, обеспечивая при этом конфиденциальность. Некоторые функции уже работают: например, заказ еды или такси через смартфон. В будущем достаточно будет сфотографировать брошюру тура, и бот найдёт похожие варианты.

В Chrome ИИ-помощник сможет искать, обобщать и сравнивать информацию с разных страниц. А функция Rambler на клавиатуре Gboard поможет надиктовать текст, очистив его от лишних слов и повторов.

Напомним, что в апреле Google уже представила новое семейство открытых ИИ-моделей Gemma 4 для сложных задач.

Вот краткий заголовок для этой новости: Хакеры начали использовать ИИ для атак и поиска уязвимостей

Вот перефразированный текст новости на русском языке:

Согласно отчету группы Google Threat Intelligence (GTIG), киберпреступники начали активно применять искусственный интеллект для поиска и использования уязвимостей, а также для автоматизации своих атак и получения доступа к сетям.

Специалисты GTIG впервые зафиксировали хакера, который создал с помощью ИИ эксплойт для уязвимости нулевого дня. Злоумышленник планировал масштабную атаку, но сотрудникам Google удалось ее предотвратить.

Кибергруппировки, связанные с КНДР, также проявили большой интерес к использованию нейросетей для обнаружения брешей в системах безопасности.

Применение ИИ в программировании ускорило создание инструментов для атак и полиморфных вирусов, которые меняют свой код. Это помогает хакерам обходить защиту и внедрять обманные алгоритмы. В Google связывают такие разработки с Россией.

Искусственный интеллект теперь используется для автономных операций. Аналитики отмечают, что вредоносное ПО вроде PROMPTSPY знаменует переход к полностью независимому управлению атаками. Модели ИИ сами анализируют систему жертвы и генерируют команды для манипуляции средой.

В отчете подчеркивается, что такой подход позволяет злоумышленникам переложить операционные задачи на ИИ, делая их деятельность более масштабной и гибкой.

Хакеры продолжают использовать нейросети как высокоскоростных помощников на всех этапах атаки и постепенно переходят к полностью автоматизированным процессам.

Кроме того, злоумышленники пытаются получить анонимный доступ к премиум-моделям ИИ, чтобы обходить лимиты и массово злоупотреблять сервисами.

В GTIG также заметили, что такие группы, как TeamPCP (известная как UNC6780), начали использовать среды разработки ИИ и программные зависимости для первоначального проникновения в инфраструктуру жертв.

Эксперты киберподразделения Google заявили, что принимают активные меры, чтобы идти на шаг впереди постоянно меняющихся угроз.

Напомним, что в сентябре 2025 года команда Anthropic уже пресекла первую в истории кампанию по кибершпионажу, полностью организованную искусственным интеллектом.

Solana и Google Cloud запустили Pay.sh для ИИ-агентов

Фонд Solana совместно с Google Cloud запустил Pay.sh — платёжную систему, предназначенную для ИИ-агентов.

Благодаря открытому стандарту, агенты смогут находить API, получать к ним доступ и оплачивать их использование стейблкоинами в сети Solana.

Pay.sh использует протокол x402 от Coinbase в качестве шлюза. Сервис совместим с аналогичным решением Machine Payments Protocol (MPP) от Tempo и Stripe.

Пользователи смогут привязывать кошельки Solana к различным платформам, включая Google Gemini и публичные системы вроде Openclaw, а также пополнять баланс через кредитную карту или стейблкоины.

После этого агенты (как под контролем человека, так и без него) могут просматривать маркетплейс API и получать доступ к сервисам без регистрации или оформления подписки.

Как это работает

Pay.sh — это протокол, созданный для ботов. На Google Cloud Platform (GCP) запускается API-прокси, который находится между ИИ-агентом и серверными решениями Google Cloud: BigQuery для анализа данных, Gemini для вызовов LLM и Cloud Run для контейнерных приложений.

Прокси проверяет подлинность и изменяет запрос агента перед отправкой в GCP, а также обрабатывает платежи через x402 или MPP.

> «Кошелёк Solana вашего агента служит его идентификатором. Это избавляет от необходимости создавать аккаунт Google или управлять обновляемыми учётными данными. Никаких подписок или минимальных трат. Агент тратит ровно столько, сколько нужно», — говорится в анонсе.

Помимо официальных API Google Cloud, к Pay.sh подключат более 50 провайдеров из сообщества: коммуникационные платформы, онлайн-магазины, поставщиков блокчейн-инфраструктуры (Helius и Alchemy), а также сервисы данных (Dune Analytics и Nansen).

Агенты могут обращаться к пяти источникам в одном запросе и платить «доли цента за каждый вызов». Это позволяет выбирать лучшее предложение и не зависеть от одного поставщика.

Напомним, в апреле разработчики x402 запустили маркетплейс приложений и сервисов, призванный повысить полезность ИИ-агентов.

Выручка Alphabet превзошла прогнозы благодаря ИИ и облачным сервисам

Вот перефразированный текст новости на русском языке:

Alphabet, материнская компания Google, отчиталась о высоком спросе на свои облачные сервисы и разработки в сфере искусственного интеллекта, сообщает Bloomberg.

Сильные финансовые результаты

Выручка корпорации за первый квартал достигла $94,7 млрд, превысив прогноз аналитиков в $91,6 млрд. Прибыль на акцию составила $5,11, тогда как Уолл-стрит ожидала $2,62. На фоне этих данных акции Alphabet подскочили более чем на 6%.

Отчет развеял опасения инвесторов относительно будущего основного бизнеса Google — монетизации поиска. Вместо спада компания активно трансформирует это направление с помощью ИИ.

Облачный сегмент продолжает быстро расти благодаря спросу на программное обеспечение и инфраструктуру для ИИ. Приложение Gemini и корпоративные инструменты набирают популярность, а количество поисковых запросов достигло рекордного уровня после внедрения нейросетей.

«ИИ улучшил поиск, а не убил его», — отметил стратег Zacks Investment Research Эндрю Рокко.

В 2026 году Alphabet планирует направить на капитальные вложения до $190 млрд, а в 2027 году расходы будут еще выше. Финансовый директор Анато Ашкенази заявила, что сильные результаты укрепляют уверенность в необходимости инвестировать в мощности для дальнейшего развития ИИ. Гендиректор Google Сундар Пичаи добавил, что компании удалось снизить затраты на обработку запросов пользователей с помощью больших языковых моделей.

Показатели облачного направления

Облачное подразделение Google отчиталось о выручке в $20 млрд, что выше прогноза в $18,4 млрд. Подразделение показало «значительное ускорение роста» за счет спроса на ПО и инфраструктуру для ИИ. Портфель заказов почти удвоился по сравнению с предыдущим кварталом и превысил $460 млрд.

Пичаи признал, что компания столкнулась с нехваткой вычислительных мощностей: «Выручка от облачных сервисов могла быть выше, если бы мы удовлетворили весь спрос. Мы работаем над этой проблемой и вкладываем средства». Ряду клиентов Google предложит тензорные процессоры (TPU) для использования в их собственных дата-центрах.

Число активных платных подписчиков Gemini Enterprise выросло на 40% за квартал. Чат-бот Gemini насчитывал 750 млн пользователей к концу 2025 года.

Новые продукты

Помимо финансового отчета, Google представила несколько новых ИИ-решений.

*Google Photos.* В сервисе появилась ИИ-функция для создания цифрового гардероба. Она позволяет придумывать новые образы и виртуально примерять их. Инструмент автоматически создает копию гардероба на основе одежды из библиотеки Google Photos. Обновление выйдет летом: сначала на Android, затем на iOS.

*Google TV.* Платформа получила набор ИИ-функций на базе Gemini и ленту коротких видео. Кнопка «Создать» открывает доступ к экспериментам с моделями Nano Banana и Veo. Первая позволяет преобразовывать фото с помощью голосовых команд, вторая — создавать видео или анимировать изображения. Также обновлено приложение «Фото»: умный поиск от Gemini помогает быстро находить нужные снимки, а функция «Ремикс» стилизует их. На главном экране появится раздел с YouTube Shorts.

*Экспорт документов в Gemini.* ИИ-помощник теперь умеет генерировать и скачивать готовые файлы для Google Docs, Microsoft Word и Excel. Поддерживаются форматы PDF, DOCX, XLSX, CSV, LaTeX, TXT, RTF и Markdown.

*Google Translate.* К 20-летию сервиса добавлен инструмент для тренировки произношения. В меню «Практика» приложение слушает пользователя, оценивает речь и дает обратную связь. Функция запускается в США и Индии, пока поддерживает английский, испанский и хинди.

Напомним, Google инвестирует до $40 млрд в Anthropic, углубляя партнерство с ИИ-стартапом.

Google представила дешевую модель для генерации видео

Google представила более дешёвую модель для создания видео

Компания Google анонсировала новую ИИ-модель Veo 3.1 Lite для генерации видео. Её использование обходится в два-три раза дешевле, чем у предыдущей версии Veo 3.1 Fast.

Модель уже доступна разработчикам. Она создаёт короткие ролики (4, 6 или 8 секунд) в горизонтальном или вертикальном формате по текстовому описанию или на основе изображения. Видео длительностью 8 секунд генерируется менее чем за минуту.

Стоимость генерации одной секунды видео в разрешении 720p с помощью Veo 3.1 Lite составляет около $0,05. Для сравнения, у версии Fast цена была $0,15, а у базовой Veo 3.1 — около $0,4 за секунду.

Запуск более доступной модели и снижение цен произошли вскоре после закрытия проекта Sora от OpenAI. Эксперты связывают решение OpenAI с высокими затратами на обслуживание сервиса.

После закрытия Sora конкурирующие сервисы, такие как Kling AI и Runway, показали рост аудитории. Число еженедельных пользователей Kling AI выросло на 4%, достигнув 2,6 млн человек. Компания-разработчик Kuaishou ожидает более чем двукратного роста годовой выручки.

Sora, запущенный осенью 2025 года, быстро набрал популярность, но затем число его пользователей начало стабильно снижаться.

Google TurboQuant: сжатие памяти для ИИ в 8 раз

Исследователи Google представили алгоритм TurboQuant для сжатия памяти в системах искусственного интеллекта. Пользователи в шутку сравнили эту разработку с технологией вымышленного стартапа Pied Piper из сериала «Кремниевая долина».

Новый алгоритм значительно сокращает объем памяти, необходимый для работы больших языковых моделей и систем векторного поиска. ИИ часто работает с большими массивами данных, которые занимают много места и замедляют обработку. Обычные методы сжатия не всегда эффективны, так как требуют хранения дополнительной информации.

TurboQuant решает эту проблему с помощью двух механизмов. Первый сжимает основные данные, переводя их в полярную систему координат. Второй, используя всего один бит памяти, корректирует возможные ошибки сжатия.

Генеральный директор Cloudflare Мэттью Принс отметил, что эта инновация напоминает ему эффективность китайской модели DeepSeek, которая также известна работой на маломощном оборудовании.

Технологию протестировали на моделях Llama, Gemma и Mistral. В результате кэш удалось сжать до трёх бит без потери качества, потребление памяти снизилось минимум в шесть раз, а скорость вычислений на ускорителях H100 выросла в восемь раз.

Для использования TurboQuant не нужно дообучать нейросети. Google планирует внедрить алгоритм в свои поисковые системы и ИИ-продукты, включая Gemini. Подробности о проекте представят на конференциях ICLR и AISTATS в 2026 году.

Напомним, в тот же день Google также анонсировала планы по переходу на постквантовую криптографию.

OpenAI представила GPT-5.3 и готовит аналог GitHub

Компания OpenAI внедрила в ChatGPT обновлённую модель GPT-5.3 Instant. Разработчики заявили, что она улучшит повседневное общение с ботом, сделав его более полезным и естественным, благодаря настройкам тона, уместности и плавности диалога.

В отличие от предыдущей версии GPT‑5.2 Instant, которая иногда давала излишне осторожные и поучительные ответы на деликатные темы, новая модель реже использует морализаторские вступления.

GPT-5.3 Instant также стала лучше работать с информацией из интернета, предоставляя более осмысленные и структурированные ответы. Она точнее улавливает контекст запроса и сочетает найденные данные с собственными знаниями.

Стиль общения модели стал естественнее, исчезли лишние фразы. Она реже «галлюцинирует» и лучше справляется с написанием текстов, хотя в OpenAI предупредили, что на некоторых языках ответы могут быть слишком буквальными.

Модель уже доступна всем пользователям ChatGPT и разработчикам через API. Поддержка GPT-5.2 Instant продлится до 3 июня 2026 года.

Аналог GitHub

По данным СМИ, OpenAI работает над созданием аналога платформы GitHub. Проект находится на ранней стадии, но стратегическое решение уже принято.

Ожидается, что сервис будет работать по платной подписке. Детали не раскрываются. Возможной причиной для разработки стали регулярные сбои GitHub, которые мешали инженерам OpenAI.

Запуск собственной платформы для хранения кода сделает компанию прямым конкурентом Microsoft, крупного акционера OpenAI и владельца GitHub.

Напомним, в конце февраля OpenAI привлекла $110 млрд инвестиций при оценке в $730 млрд, что стало одним из крупнейших раундов финансирования для стартапов.

Обновлённый Gemini

Компания Google, в свою очередь, выпустила предварительную версию модели Gemini 3.1 Flash-Lite, которую называет самой экономичной и быстрой в семействе Gemini 3.

Стоимость использования составляет $0,25 за миллион входных и $1,5 за миллион выходных токенов.

Модель оптимизирована для создания ИИ-агентов и масштабируемых задач, таких как обработка больших данных, модерация контента и генерация интерфейсов.

По данным независимых исследователей, новинка обрабатывает информацию в 2,5 раза быстрее, чем Gemini Flash 2.5.

Версия 3.1 Flash-Lite в режиме предпросмотра доступна разработчикам через API Gemini и в Google AI Studio, а для бизнеса — в Vertex AI.

В феврале Google также представила обновлённую модель Gemini 3.1 Pro, установившую рекорды в тестах, и улучшила режим рассуждений Gemini 3 Deep Think для сложных научных и инженерных задач.

Google обновил ИИ-инструмент Opal для вайб-кодинга

ad993d64 db99 4d45 a632 e2df0722beb1 scaled

Корпорация Google выпустила крупное обновление для своего ИИ-инструмента Opal, предназначенного для создания приложений и автоматизации задач без написания кода (вайб-кодинг). Главным нововведением стал интеллектуальный агент, который умеет самостоятельно планировать и выполнять сложные рабочие процессы.

Этот агент, работающий на базе модели Gemini 3 Flash, анализирует текстовую задачу от пользователя, определяет лучший способ её решения и автоматически подключает необходимые инструменты. Например, он может использовать веб-поиск для сбора данных, генерировать видео с помощью Veo или интегрироваться с Google Sheets для сохранения информации.

Ключевая особенность агента — интерактивность. Если ему для выполнения задачи не хватает данных, он запросит уточнения у пользователя или предложит свои варианты следующих шагов. Это позволяет даже людям без технических навыков создавать сложные автоматизированные процессы в своих приложениях.

Opal был впервые представлен в июле 2025 года, а в декабре стал доступен в веб-версии Gemini, получив визуальный редактор для сборки готовых продуктов. Обновление усиливает конкуренцию на рынке вайб-кодинга, где уже представлены такие решения, как Lovable, Replit, а также инструменты от OpenAI (Codex) и Anthropic. Ранее в феврале аналогичную функцию «команды агентов» получила и флагманская модель Claude Opus 4.6 от Anthropic.

Google отложила запуск Aluminium OS до 2028 года

Заголовок: Новая ОС Google Aluminium OS на базе ИИ, объединяющая Android и ChromeOS, появится не раньше 2028 года

Текст:

Появление новой операционной системы Google на базе искусственного интеллекта, получившей название Aluminium OS и призванной объединить Android и ChromeOS, ожидается не ранее 2028 года. Такая информация следует из судебных документов по антимонопольному делу.

Ранее, в сентябре 2025 года, глава Android в Google Самир Самат заявлял о планах на прогресс в разработке ОС уже в 2026 году. Однако, согласно юридическим документам, самый оптимистичный сценарий предполагает предоставление системы «коммерчески доверенным тестерам» лишь в конце 2026 года, а полный релиз — только в 2028.

Даже после выхода новая ОС не будет совместима со всеми существующими устройствами. Google продолжит поддержку ChromeOS как минимум до 2033 года. В январе руководитель ChromeOS Джон Малетис подтвердил, что компания выполнит обещание о 10 годах автоматических обновлений для устройств на этой платформе. Он также отметил, что не все устройства смогут перейти на новую платформу из-за технических ограничений.

При этом корпорация намерена отказаться от ChromeOS, как только это станет возможным. Согласно судебным документам, срок полного поэтапного отказа от этой операционной системы — 2034 год. Более ранний отказ невозможен из-за законодательства некоторых стран, регулирующего минимальные сроки поддержки устройств.

Напомним, что в сентябре 2025 года суд постановил, что Google не обязана продавать браузер Chrome отдельно, признав такое требование чрезмерной мерой.

Google добавил в Chrome новые ИИ-инструменты Gemini

Google внедряет в браузер Chrome новые инструменты на базе искусственного интеллекта Gemini. Основными новшествами стали генератор изображений Nano Banana, функция «Персональный интеллект» и «Автопросмотр».

ИИ-ассистент, который был добавлен в виде плавающего окна в сентябре 2025 года, теперь закреплён на боковой панели. Он позволяет пользователям задавать вопросы о просматриваемом сайте или других открытых вкладках. Также появилась возможность анализировать несколько вкладок как единый контекст. Ранее Gemini в Chrome был доступен только на Windows и macOS, теперь он открыт и для пользователей Chromebook Plus.

Функция «Персональный интеллект», которая использует данные из аккаунтов Gmail, Поиска, YouTube и Google Фото, позволит в ближайшие месяцы задавать чат-боту вопросы, например, о расписании семьи, или составлять черновики писем, не переключаясь на почту.

Инструмент Nano Banana даёт возможность редактировать и изменять изображения, используя в качестве образцов другие картинки из интернета.

«Автопросмотр» — это ИИ-агент, способный самостоятельно выполнять задачи: переходить по ссылкам, совершать покупки или искать скидочные купоны. Он запросит вмешательство пользователя только при необходимости работы с конфиденциальными данными.

Однако ИИ-браузеры несут в себе риски для безопасности. В декабре 2025 года OpenAI сообщила об уязвимостях, таких как «инъекция промпта», и признала, что подобные проблемы вряд ли будут полностью устранены. Компании Anthropic и Google также признают эти риски, делая ставку на многоуровневую защиту.

Параллельно Google представила функцию Agentic Vision для модели Gemini 3 Flash. Она позволяет детально изучать изображения, действуя по принципу «думать, действовать, наблюдать»: ИИ анализирует запрос, составляет план, выполняет действия с изображением (например, кадрирование) и оценивает результат. Это повышает точность распознавания на 5-10%. Бета-версия Agentic Vision уже доступна разработчикам.