Em 31 de janeiro de 2023, a OpenAI lançou uma ferramenta de classificação de texto de IA com o objetivo de detectar se as passagens foram escritas por um sistema humano ou de IA. Esse lançamento foi definido para mudar o cenário da detecção de conteúdo sintético e ajudar as instituições a sinalizar esse tipo de conteúdo. No entanto, apenas alguns meses após seu lançamento, a OpenAI interrompeu abruptamente a ferramenta devido à sua taxa de precisão decepcionantemente baixa na diferenciação de escrita humana e de IA.

O classificador da OpenAI e suas deficiências

A ferramenta de classificação de texto da OpenAI tinha como objetivo detectar conteúdo gerado por IA analisando recursos linguísticos em passagens de texto. Ela atribuiria uma “classificação de probabilidade” para indicar se o sistema determinou que o texto foi escrito por um ser humano ou por uma IA. Após o lançamento, a ferramenta ganhou popularidade à medida que crescia o interesse pela detecção de IA.

No entanto, apenas alguns meses depois, em 20 de julho de 2023, a OpenAI anunciou que estava descontinuando o classificador devido à sua baixa taxa de precisão. Na prática, o sistema teve dificuldades significativas para diferenciar de forma confiável a escrita humana da escrita automática. Apesar de analisar padrões linguísticos, o classificador muitas vezes não conseguia identificar corretamente se as passagens eram geradas por IA ou não. Nossa pesquisa completa sobre os melhores detectores de IA revelou uma taxa de detecção surpreendentemente baixa para a ferramenta implementada pela Open AI.

O desafio mais amplo do avanço dos detectores de IA

A falha abrupta do classificador da OpenAI ressalta os desafios contínuos enfrentados no desenvolvimento de sistemas precisos de detecção de IA. Pesquisas recentes revelaram pontos fracos e vieses significativos entre os verificadores de IA atuais.

Estudos descobriram que essas ferramentas frequentemente rotulam erroneamente o texto escrito por humanos como sendo gerado por IA.

Além disso, muitos softwares de detecção de IA não são treinados em novos LLMs e não conseguem detectá-los. Eles também podem ser facilmente contornados por ferramentas de parafraseamento, como o Quillbot.

O rápido avanço da IA generativa também significa que as ferramentas de detecção são frequentemente ultrapassadas, permitindo uma evasão mais fácil. O principal objetivo da Winston AIé aprimorar continuamente seu modelo para detectar a escrita de IA e, ao mesmo tempo, minimizar as ocorrências de falsos positivos.

A necessidade de melhores soluções

Embora a tecnologia de detecção de IA continue sendo extremamente importante para a responsabilidade à medida que o conteúdo artificial se espalha, exemplos como o OpenAI mostram que a tarefa não é fácil. A missão principal da Winston AI é detectar a IA, enquanto muitos outros detectores alternativos de IA são fornecidos como um projeto paralelo. A OpenAI declarou seu compromisso com o desenvolvimento de técnicas de procedência mais robustas, mas a rápida falha de seu classificador revela que o aperfeiçoamento desses sistemas continua difícil.

Alguns dizem que o ritmo de desenvolvimento da IA generativa atualmente supera a inovação nos métodos de detecção, mas a Winston AI tem, de longe, o modelo de detecção de IA mais preciso disponível.

Conclusão

A interrupção abrupta do classificador de texto de IA da OpenAI após apenas alguns meses demonstra os desafios formidáveis que permanecem no desenvolvimento de ferramentas confiáveis de detecção de IA. Seu classificador fracassou rapidamente, apesar de ter como objetivo diferenciar a escrita humana da escrita automática por meio da análise de padrões linguísticos.

Grandes empresas que lideram o movimento de IA, incluindo Amazon, Anthropic, Google, Inflection, Meta, Microsoft e Open AI, reuniram-se com o governo Biden-Harris e assumiram compromissos voluntários para promover o desenvolvimento seguro, protegido e transparente da IA. Isso inclui a adição de marcas d’água para garantir a capacidade de detectar a IA, especialmente falsificações profundas.

À medida que o conteúdo artificial se espalha, o desenvolvimento de uma tecnologia de detecção de IA mais robusta torna-se cada vez mais crucial para manter a transparência e a confiança. Embora longe de ser perfeito, o aprimoramento dessas ferramentas por meio de pesquisa e progresso contínuos continua sendo essencial.

PERGUNTAS FREQUENTES

Qual era a ferramenta de classificação de texto da OpenAI e qual era sua finalidade?

O classificador de texto da OpenAI foi um sistema de IA lançado em 31 de janeiro de 2023 com o objetivo de detectar se as passagens de texto foram escritas por um ser humano ou por um sistema de IA. Ele foi projetado para analisar os recursos linguísticos da escrita e atribuir uma “classificação de probabilidade” para indicar se o conteúdo foi gerado por IA. O objetivo era ajudar a atender à crescente necessidade de identificar conteúdo artificial à medida que os sistemas de IA geradores se tornassem mais avançados.

Por que a OpenAI acabou fechando seu classificador de texto depois de apenas alguns meses?

A OpenAI descontinuou seu classificador de texto em julho de 2023, poucos meses após seu lançamento, devido à sua taxa de precisão decepcionantemente baixa na diferenciação da escrita humana e de IA. Na prática, o sistema teve dificuldades para distinguir de forma confiável o conteúdo escrito por humanos e por máquinas por meio de sua análise linguística.

Por que o aprimoramento da tecnologia de detecção de IA continua sendo importante, apesar dos desafios?

Embora seja difícil desenvolver uma detecção precisa de IA, ela continua sendo extremamente importante para a responsabilidade à medida que o conteúdo artificial se espalha. Ferramentas como a da OpenAI, apesar das falhas, visam manter a transparência sobre a procedência do texto e de outras mídias. À medida que a IA generativa avança, soluções melhores são essenciais, mesmo que o progresso seja lento.

Que medidas estão sendo tomadas para tentar melhorar os recursos de detecção de IA?

As principais empresas de IA se comprometeram a promover o desenvolvimento seguro e transparente da IA, incluindo o aprimoramento dos recursos de detecção de conteúdo de IA. Pesquisas em andamento também continuam trabalhando para fortalecer as ferramentas de detecção e minimizar as falsas identificações de conteúdo criado por humanos. No entanto, aperfeiçoar esses sistemas continua sendo um desafio à medida que os recursos de IA se expandem rapidamente.

Thierry Lavergne

Co-fundador e Chief Technology Officer (CTO) da Winston AI. Com mais de 15 anos de experiência em desenvolvimento de software, sou especializado em Inteligência Artificial e aprendizado profundo. Na Winston AI, lidero a visão tecnológica, com foco no desenvolvimento de soluções inovadoras de detecção de IA. Gosto de escrever sobre tudo relacionado à IA e tecnologia.