Ao longo da história, os avanços na abstração e recuperação de informações impulsionaram o progresso humano. Desde os hieróglifos e papiros até a impressão e a digitalização, cada avanço tornou o conhecimento humano mais acessível e aplicável, alimentando inovações adicionais.
Atualmente, estamos prestes a dar o próximo grande salto: desbloquear a inteligência coletiva de todas as informações digitalizadas. Aproximadamente 90% dos dados organizacionais do mundo estão armazenados como documentos. Neste contexto, apresentamos o Mistral OCR.
O Mistral OCR é uma API de Reconhecimento Óptico de Caracteres que redefine os padrões de compreensão de documentos. Diferente de outros modelos, o Mistral OCR entende cada elemento dos documentos—imagens, textos, tabelas e equações—com uma precisão e cognição sem precedentes. Ele aceita imagens e PDFs como entrada e extrai conteúdo em um texto intercalado e ordenado com imagens.
A implementação do Mistral OCR como modelo padrão para a compreensão de documentos já está disponível para milhões de usuários no Le Chat. A API mistral-ocr-latest está sendo lançada a 1000 páginas por dólar (e cerca do dobro de páginas por dólar com inferência em lote). A API já pode ser acessada na nossa plataforma para desenvolvedores, la Plateforme, e em breve estará disponível para nossos parceiros de nuvem e inferência, assim como em instalações locais.
Entre os destaques do Mistral OCR, podemos ressaltar a excelência na compreensão de documentos complexos, a capacidade multilíngue nativa, o desempenho superior em benchmarks, e a opção de auto-hospedagem para organizações que lidam com informações altamente sensíveis ou classificadas.
O Mistral OCR se destaca em entender elementos complexos de documentos, incluindo imagens intercaladas e expressões matemáticas. Essa capacidade de compreensão mais profunda permite análises ricas de documentos, como artigos científicos com gráficos e equações. Comparações lado a lado entre PDFs e seus respectivos resultados de OCR demonstram a eficiência do modelo.
Nos testes de benchmark, o Mistral OCR superou consistentemente outros modelos de OCR líderes. Sua precisão superior em várias análises de documentos é evidente, mostrando a capacidade de extrair imagens integradas junto ao texto, algo que outros LLMs não conseguem.
Desde sua fundação, a Mistral se empenha em oferecer modelos que atendam a um público global, e o Mistral OCR eleva essa proposta a um novo patamar, sendo capaz de analisar e transcrever milhares de scripts e idiomas.
Com um desempenho rápido, o Mistral OCR processa até 2000 páginas por minuto em um único nó, garantindo aprendizado contínuo, mesmo em ambientes de alta demanda. Além disso, a nova funcionalidade de usar documentos como prompts permite instruções mais poderosas e precisas, facilitando a extração de informações específicas e sua formatação em saídas estruturadas.
Para organizações com rigorosas exigências de privacidade de dados, o Mistral OCR oferece uma opção de auto-hospedagem, garantindo que informações sensíveis permaneçam seguras em sua própria infraestrutura.
Estamos capacitando nossos clientes beta a transformar seus vastos repositórios documentais em ações e soluções. Entre os principais casos de uso, destacam-se a digitalização de pesquisas científicas, a preservação do património histórico e cultural, e a otimização do atendimento ao cliente, que se beneficiam da tecnologia oferecida pelo Mistral OCR.
Experimente o Mistral OCR gratuitamente no Le Chat. Para acessar a API, visite a la Plateforme. Estamos ansiosos pelo seu feedback e esperamos que o modelo continue a melhorar nas próximas semanas.
?si=qLSblC2rsBdxg4qu
Confira os últimos vídeos publicados no canal