Gigantes da tecnologia ampliam limites para alimentar o apetite de dados da IA

By James Kinoti
Atualizado: 6 de abril de 2024, 12h39 UTC

3 minutos de leitura

507313

Conteúdo

1. Iniciativa sussurrante da OpenAI: Minerando conversas no YouTube

2. A crise de dados: impulsionando abordagens não convencionais

3. O imperativo para conjuntos de dados massivos

Compartilhar link:

Nesta postagem:

Os gigantes da tecnologia recorrem a métodos controversos para coletar dados de IA.
OpenAI transcreve vídeos do YouTube, e Google e Meta estão considerando comprar conteúdo protegido por direitos autorais.
Surgem debates jurídicos e éticos sobre o uso de vastos conjuntos de dados pela IA.

Quer exista o trabalho da OpenAI , Google e Meta, AI financiando o sector industrial, que compreende vários meios como a recolha ou acumulação de enormes volumes de dados digitais de diferentes formas criativas mas controversas, é claro que as capacidades e capacidades de automação estão a aumentar. Notavelmente, os esforços que envolvem ações como a adoção das medidas descritas acima (ou seja, levar em consideração os limites legais e as políticas corporativas) são equivalentes à quantidade considerável de dados utilizados para treinar os sistemas de IA.

Iniciativa sussurrante da OpenAI: Minerando conversas no YouTube

Nossa história do Whisper começou no ano passado. Há uma escassez esmagadora de textos em inglês de primeira qualidade que causa atrasos na entrega da educação. Whisper foi o próximo passo do Google. Ele compreendeu o oceano de diálogos do YouTube e foi desenvolvido como texto, um aplicativo de conversão de texto em fala. A própria ferramenta alimentada por IA, que consiste em mais de um milhão de horas de vídeos do YouTube auditados pela IA para gerar novos textos (essencialmente, uma nova conversa), tem sido utilizada para treinar modelos de IA produzidos a partir do estado da arte. até GPT-4, a versão mais recente do chatbot ChatGPT.

Embora alguns funcionários argumentassem que as imagens da Microsoft da OpenAI plagiariam o YouTube em todos os aspectos, a ética do plágio ainda era discutível; além disso, alguns trabalhadores admitiram que seria impossível alinhar com precisão as intenções do YouTube. Da mesma forma, a obtenção de objeções no processamento algorítmico dos vídeos paratraco conteúdo textual para alimentar os modelos de IA pode ter sido considerada uma ameaça aos direitos autorais dos criadores de vídeos, causando indignação.

Veja também Donald Trump Dinner Hype eleva Melania, apesar de contínua venda de US $ 18 milhões

A Meta, controladora do Facebook e do Instagram, também se preocupou em usar elementos protegidos por direitos autorais de editoras como Simon & Schuster, entre outras. Ao mesmo tempo, também discutiu a aquisição de conteúdo geral da web, potencialmente para ser pego em violação de direitos autorais.

A crise de dados: impulsionando abordagens não convencionais

A coleta de dados repleta de concorrência ajuda a observar a posição central dos dados edentla no desenvolvimento da tecnologia de IA. A linguagem em uma IA comanda cada vez mais conjuntos de dados de treinamento, incluindo o Commonwealth, que hoje são manipulados até a Wikipedia e Reddit de fora dessas fontes. Para as empresas de tecnologia – especialmente aquelas que têm dificuldade em alcançar fontes de dados muito comuns, como armazenamentos de dados tradicionais – a criação de modelos alimentados por IA pode ser uma solução alternativa que pode ser bastante desejável em tais casos.

As empresas do setor técnico indicam que a coleta de dados é necessária para o treinamento em IA, enquanto o mesmo processo está legalmente em questão no tribunal. Em sua defesa, a OpenAI e a Microsoft venceram uma alegação sobre o emprego ilegal de material protegido por direitos autorais contra elas. Ainda assim, eles disseram que as suas ações se enquadravam no princípio legal do uso justo. Nos últimos anos, o número de pedidos apresentados ao Gabinete de Direitos de Autor dos EUA pelos detentores de direitos de autor ultrapassou o número de 10.000, o que mostra claramente que a lei de direitos de autor na era da IA é única e totalmente nova. Consequentemente, os principais intervenientes enfrentam sempre perigos relacionados com a violação de muitas obras, sob o pretexto de que não existem finalidades licenciadas para os modelos que utilizam IA nesta base.

Veja também Ouro e Bitcoin estão se unindo juntos, o dólar está em apuros?

O imperativo para conjuntos de dados massivos

No geral, o trabalho de Kaipan, de Jared, cientista da escala, foi involuntariamente épico no desenvolvimento da IA. O conteúdo baseado em dados é um dos componentes da IA necessários para o processo de formação, mas não pode funcionar bem sem os modelos que foram bem treinados e funcionam de forma eficaz. Com o aumento da tecnologia de inteligência artificial, a procura de dados para ter sucesso no mercado aumenta a um ritmo elevado, deixando as empresas com questões relacionadas com a lei, a ética e a privacidade. Portanto, os algoritmos de inteligência artificial devem utilizar esses conjuntos de dados para ter sucesso no mercado.

O comportamento de coleta de dados dos V.IPs está sendo desfigurado para melhorias na IA o juramento metodológico típico está sendo grosseiro. Seja através de uma de suas palestras no YouTube ou da criação de dados sintéticos geradores, essas empresas são líderes em uma missão para descobrir quais são realmente as questões legais, éticas e de privacidade.

Eles podem se tornar uma piada no mar mais tarde. Devido ao aparecimento de enormes conjuntos de dados necessários para impulsionar o processo de inovação, os líderes da sociedade são obrigados a participar activamente num diálogo construtivo para desenvolver regras e padrões em que os esforços de inovação sejam equilibrados com princípios éticos de direitos de propriedade intelectual e privacidade.

História original de: https://www.nytimes.com/2024/04/06/technology/tech-giants-harvest-data-artificial-intelligence.html

Academia Cryptopolitan: em breve - uma nova maneira de obter renda passiva com DeFi em 2025. Saiba mais

Compartilhar link:

Leia a isenção de responsabilidade

Isenção de responsabilidade. As informações fornecidas não são conselhos de negociação. Cryptopolitan.com não se responsabiliza por quaisquer investimentos feitos com base nas informações fornecidas nesta página. Recomendamos tron dent e /ou consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Escolha do editor

Carregando artigos da Escolha do Editor...

Gigantes da tecnologia ampliam limites para alimentar o apetite de dados da IA

Conteúdo

Nesta postagem:

Iniciativa sussurrante da OpenAI: Minerando conversas no YouTube

A crise de dados: impulsionando abordagens não convencionais

O imperativo para conjuntos de dados massivos

Compartilhar link:

Mais Lidos

Fique por dentro das notícias sobre criptografia, receba atualizações diárias em sua caixa de entrada

Escolha do editor

Cadastre-se e fique por dentro

Os mercados se movem rapidamente.

Nós nos movemos mais rápido.

Entre. Obtenha os fatos.
Siga em frente.

Gigantes da tecnologia ampliam limites para alimentar o apetite de dados da IA

Conteúdo

Nesta postagem:

Iniciativa sussurrante da OpenAI: Minerando conversas no YouTube

A crise de dados: impulsionando abordagens não convencionais

O imperativo para conjuntos de dados massivos

Compartilhar link:

Mais Lidos

Fique por dentro das notícias sobre criptografia, receba atualizações diárias em sua caixa de entrada

Escolha do editor

Cadastre-se e fique por dentro

Siga-nos

- O boletim informativo criptográfico que o mantém à frente -

Os mercados se movem rapidamente.

Nós nos movemos mais rápido.

Entre. Obtenha os fatos. Siga em frente.

Entre. Obtenha os fatos.
Siga em frente.