Больше не нужно искать — необходимые
обучающие материалы и подсказки всегда под рукой
DeepSeek представила модель DeepSeek-OCR 2, которая «видит» изображения с человеческой логикой
27 января. Компания DeepSeek анонсировала новую модель DeepSeek-OCR 2. В её основе лежит инновационный метод DeepEncoder V2, который позволяет искусственному интеллекту анализировать изображения не механически (например, слева направо), а динамически перестраивать порядок обработки частей изображения в зависимости от их смысла. Этот подход имитирует логическую последовательность, которую использует человек при восприятии сцены.
В результате модель демонстрирует превосходство над традиционными визуально-языковыми моделями при работе со сложно структурированными изображениями, такими как документы или диаграммы. Это обеспечивает более интеллектуальное и причинно-следственное понимание визуальной информации.