A Microsoft esclarece: os documentos de usuários da suíte Microsoft 365 não são utilizados para treinar grandes modelos de linguagem (LLMs). A empresa se posicionou sobre o assunto após um tuíte sobre coleta de dados ter viralizado no X, antigo Twitter.
“Fique atento: o Microsoft Office, assim como várias outras companhias nos últimos meses, maliciosamente ativaram um recurso opcional que varre seus documentos Word e Excel para treinar seus modelos de IA internos”, disse o post original, publicado pelo usuário @nixcraft no X. “Essa opção é ativada por padrão, e você precisa desmarcá-la manualmente para desabilitá-la”, continuou.
No post, o usuário destacou a função “Connected Experiences” contido no menu de configurações de documentos em apps do Microsoft 365. Supostamente, a coleta de dados aconteceria por meio dessa ferramenta.
In the M365 apps, we do not use customer data to train LLMs. This setting only enables features requiring internet access like co-authoring a document. https://t.co/o9DGn9QnHb
— Microsoft 365 (@Microsoft365) November 25, 2024
A publicação original acumula 536,9 mil visualizações no momento da elaboração dessa matéria. Provavelmente, isso foi suficiente para chamar a atenção da Microsoft que, em uma das respostas, reforçou que documentos pessoais não são usados para treinar LLMs.
“Em aplicativos do Microsoft 365, nós não utilizamos dados de usuários para treinar LLMs. Essa configuração apenas ativa recursos que precisam de conexão com a internet, como a coautoria de documentos”, pontuou.
Falso, mas atenção é necessária
Embora o alerta divulgado pelo usuário não seja verdadeiro, reforça o estado de alerta de usuários para a coleta de dados, principalmente para ferramentas voltadas para treinamento de IA. Dado o histórico controverso da Microsoft na área, não é uma surpresa que um rumor como esse tenha circulado nas redes.
De toda forma, este não é o caso. Portanto, se você é um profissional que usa apps da suíte da Microsoft (Word, Excel ou PowerPoint, por exemplo) para produzir conteúdo totalmente privado, não precisa se preocupar em ter seus documentos varridos para treinar modelos da empresa.