Применение искусственного интеллекта для систем хранения данных


11.12.20. На Google Cloud появился ИИ-сервис для извлечения данных из документов и форм


Google запустил на своей облачной платформе новый когнитивный API-сервис Document AI, который позволяет автоматически извлекать информацию, содержащуюся в цифровых и печатных документах, с помощью машинного обучения. Предполагается использование двух процессоров общего назначения, первый - для обычных документов, второй - для анкет/форм. Есть также специализированные процессоры для финансовой документации, например, можно обрабатывать заявки на выдачу ссуд или счета-фактуры. Главными конкурентами Google в этом сегменте являются компания Amazon, которая предлагает подобный сервис Textract на AWS, а также Microsoft со своим инструментом Form Recogniser.


2016. IBM создала СХД, которая определяет важность данных с помощью машинного обучения


В условиях переизбытка информации компании, использующие СХД сталкиваются с проблемой: как отделить важную информацию от тонн информационного мусора. Исследователи из цюрихского R&D-подразделения IBM представили когнитивную платформу хранения для больших данных, которая способна самостоятельно определить важность информации. Определение этих ключевых данных из всего массива информации происходит с помощью сложных алгоритмов, которые учитывают не только частоту доступа, уровень защиты, дату создания и т. п., но и следят за тем, как люди взаимодействуют с той или иной частью базы данных. При этом система может сама обнаруживать малоценную информацию и удалять ее или отправлять на дешевые второстепенные низкопроизводительные накопители.