AI의 데이터 욕구를 충족시키기 위해 경계를 넓히는 거대 기술 기업

By James Kinoti
업데이트 날짜: 2024년 4월 6일 오후 12:39 UTC

3분 읽기

507313

내용물

1. OpenAI의 속삭임 이니셔티브: YouTube 대화 마이닝

2. 데이터 위기: 틀에 얽매이지 않는 접근 방식 추진

3. 대규모 데이터 세트의 필수 요소

공유 링크:

이 게시물에서:

거대 기술 기업들은 AI 데이터를 수집하기 위해 논란의 여지가 있는 방법을 사용합니다.
OpenAI는 YouTube 동영상을 복사하고 Google과 Meta는 저작권이 있는 콘텐츠 구매를 고려하고 있습니다.
AI가 방대한 데이터 세트를 사용하는 것에 대해 법적, 윤리적 논쟁이 발생합니다.

OpenAI 의 작업이 있든 자동화 능력과 능력이 향상되고 있다는 것은 분명합니다. 특히 위에 설명된 조치를 취하는 것(즉, 법적 제한 및 기업 정책을 고려하는 것)과 같은 조치를 수반하는 노력은 AI 시스템을 훈련하는 데 사용되는 상당한 양의 데이터에 해당합니다.

OpenAI의 속삭임 이니셔티브: YouTube 대화 마이닝

우리의 속삭임 이야기는 작년에 시작되었습니다. 일류 영어 교재가 압도적으로 부족하여 교육 제공이 지연되고 있습니다. Whisper는 Google의 다음 단계였습니다. YouTube의 대화의 바다를 이해하고 텍스트 음성 변환 애플리케이션인 텍스트로 개발되었습니다. AI가 감사하여 새로운 텍스트(기본적으로 새로운 대화)를 생성하는 백만 시간 이상의 YouTube 동영상으로 구성된 AI 기반 도구 자체는 최첨단 기술로 생성된 AI 모델을 훈련하는 데 활용되었습니다. ChatGPT 챗봇의 최신 버전인 GPT-4까지.

일부 직원은 OpenAI의 Microsoft 영상이 YouTube를 전반적으로 표절할 것이라고 주장했지만 표절 윤리는 여전히 논쟁의 여지가 있었습니다. 또한 일부 직원은 YouTube의 의도와 정확히 일치하는 것이 불가능하다고 인정했습니다. 마찬가지로, AI 모델에 제공하기 위해 텍스트 콘텐츠를trac하기 위해 비디오를 알고리즘적으로 처리하는 과정에서 이의를 얻은 것은 비디오 제작자의 저작권에 대한 위협으로 간주되어 분노를 불러일으켰을 수 있습니다.

참조 도널드 트럼프 디너 과대 광고는 1,800 만 달러의 토큰 매도에도 불구하고 멜라니 아를 들어 올립니다.

Facebook과 Instagram의 모회사인 Meta도 Simon & Schuster와 같은 출판사의 저작권이 있는 요소를 사용하는 것에 대해 우려했습니다. 동시에, 저작권 침해에 걸릴 가능성이 있는 일반 웹 콘텐츠의 취득에 대해서도 논의했습니다.

데이터 위기: 틀에 얽매이지 않는 접근 방식 추진

경쟁이 치열한 데이터 수집은 AI 기술 개발에서 데이터의 중추적 위치를 확인하고 이를dent데 도움이 됩니다. AI에 대한 언어는 오늘날 이러한 소스 외부에서 Wikipedia 및 Reddit까지 조작되는 Commonwealth를 포함하여 점점 더 많은 교육 데이터 세트를 명령합니다. 기술 기업, 특히 기존 데이터 저장소와 같이 매우 일반적인 데이터 소스에 접근하는 데 어려움을 겪는 기업의 경우 AI 기반 모델을 만드는 것이 그러한 경우에 충분히 바람직할 수 있는 대안 솔루션이 될 수 있습니다.

기술에 포함된 기업들은 AI 훈련에 데이터 수집이 필요하다고 명시하고 있지만, 법적으로는 동일한 과정이 법원에서 문제가 되고 있다. 방어하기 OpenAI 와 Microsoft는 저작권 자료를 불법적으로 사용했다는 주장에서 승리했습니다. 그럼에도 그들은 자신들의 행위가 공정이용이라는 법적 원칙에 부합한다고 말했다. 최근 몇 년간 저작권 보유자가 미국 저작권청에 제출한 신청서 수가 10,000건을 넘었습니다. 이는 AI 시대의 저작권법이 독특하고 새로운 것임을 여실히 보여줍니다. 결과적으로, 주요 참가자들은 이를 기반으로 AI를 사용하는 모델에 대한 라이센스 목적이 없다는 것처럼 가장하여 많은 저작물 침해와 관련된 위험에 항상 직면합니다.

또한 금과 Bitcoin 함께 모이고 있습니다. 달러가 문제가 있습니까?

대규모 데이터 세트의 필수 요소

전반적으로, 규모의 과학자인 Kaipan의 작품 de Jared는 AI 개발에서 의도치 않게 서사적이었습니다. 데이터 기반 콘텐츠는 훈련 과정에 필요한 AI 구성 요소 중 하나이지만, 잘 훈련되고 효과적으로 작동하는 모델 없이는 제대로 작동할 수 없습니다. 인공지능 기술이 발전함에 따라 시장에서 성공하기 위한 데이터에 대한 수요가 급속도로 증가하면서 기업은 법률, 윤리, 개인 정보 보호와 관련된 문제를 안고 있습니다. 따라서 인공지능 알고리즘이 시장에서 성공하려면 이러한 데이터 세트를 사용해야 합니다.

AI 위해 V.IP의 데이터 수집 동작이 왜곡되고 있습니다 . 전형적인 방법론적 맹세가 거칠어지고 있다. YouTube 강연을 통해서든 합성 데이터 생성을 통해서든 이들 회사는 법률, 윤리, 개인 정보 보호 문제가 실제로 무엇인지 알아내는 사명을 지닌 리더입니다.

나중에 바다에서 농담이 될 수도 있습니다. 혁신 프로세스를 추진하는 데 필요한 엄청난 양의 데이터 세트가 등장함에 따라 사회 지도자들은 혁신 노력이 지적 재산권 및 개인 정보 보호의 윤리적 원칙과 균형을 이루는 규칙 및 표준을 개발하기 위한 건설적인 대화에 적극적으로 참여해야 합니다.

원본 기사: https://www.nytimes.com/2024/04/06/technology/tech-giants-harvest-data-artificial-intelligence.html

-2025 년 DeFi 로 수동적 소득을 얻는 새로운 방법. 자세히 알아보십시오.

공유 링크:

면책 조항 읽기

부인 성명. 제공된 정보는 거래 조언이 아닙니다. Cryptopolitan.com은 이 페이지에 제공된 정보를 기반으로 한 투자에 대해 책임을 지지 않습니다. 우리는 dent 연구 및/또는 자격을 갖춘 전문가와의 상담을 tron 권장합니다

가장 많이 읽은 것

암호화폐 뉴스를 최신 상태로 유지하고 받은 편지함에서 매일 업데이트를 받으세요

편집자의 선택

편집자 선정 기사 로드 중...

AI의 데이터 욕구를 충족시키기 위해 경계를 넓히는 거대 기술 기업

내용물

이 게시물에서:

OpenAI의 속삭임 이니셔티브: YouTube 대화 마이닝

데이터 위기: 틀에 얽매이지 않는 접근 방식 추진

대규모 데이터 세트의 필수 요소

공유 링크:

가장 많이 읽은 것

암호화폐 뉴스를 최신 상태로 유지하고 받은 편지함에서 매일 업데이트를 받으세요

편집자의 선택

가입하고 최고의 자리를 유지하세요

시장은 빠르게 움직입니다.

우리는 더 빨리 움직입니다.

들어가십시오. 사실을 얻으십시오.
앞으로 나아가십시오.

AI의 데이터 욕구를 충족시키기 위해 경계를 넓히는 거대 기술 기업

내용물

이 게시물에서:

OpenAI의 속삭임 이니셔티브: YouTube 대화 마이닝

데이터 위기: 틀에 얽매이지 않는 접근 방식 추진

대규모 데이터 세트의 필수 요소

공유 링크:

가장 많이 읽은 것

암호화폐 뉴스를 최신 상태로 유지하고 받은 편지함에서 매일 업데이트를 받으세요

편집자의 선택

가입하고 최고의 자리를 유지하세요

우리를 따르라

- 당신을 미리 유지하는 암호화 뉴스 레터 -

시장은 빠르게 움직입니다.

우리는 더 빨리 움직입니다.

들어가십시오. 사실을 얻으십시오. 앞으로 나아가십시오.

들어가십시오. 사실을 얻으십시오.
앞으로 나아가십시오.