OpenAI の取り組みの有無に関わらず、産業界に資金を提供する AI は、創造的ではあるが物議を醸すさまざまな方法で膨大な量のデジタル データを収集または蓄積するなどのさまざまな手段で構成されており、自動化の能力と機能が増加していることは明らかです。 特に、上記で概説した措置を講じる(つまり、法的制限や企業ポリシーを考慮する)などの措置を伴う取り組みは、AI システムのトレーニングに使用される相当量のデータに相当します。
OpenAI のウィスパー イニシアチブ: YouTube の会話のマイニング
私たちの Whisper の物語はちょうど昨年始まりました。 第一級の英語テキストが圧倒的に不足しており、教育の提供に遅れが生じています。 Whisper は Google による次のステップでした。 これは YouTube の対話の海を理解し、テキスト、つまりテキスト読み上げアプリケーションとして開発されました。 AI を活用したツール自体は、AI によって監査されて新しいテキスト (本質的には新しい会話) を生成する 100 万時間以上の YouTube 動画で構成されており、最先端の技術から生成された AI モデルのトレーニングに利用されています。 ChatGPT チャットボットの最新バージョンである GPT-4 まで。
一部の従業員は、OpenAI の Microsoft 映像が YouTube を全面的に盗用するものであると主張しましたが、盗作の倫理については依然として議論の余地がありました。 さらに、一部の従業員は、YouTube の意図に正確に沿うことは不可能であることを認めました。 同様に、AI モデルに供給するテキスト コンテンツをtracするためにビデオをアルゴリズム的に処理する際に異議が得られたことは、ビデオ作成者の著作権に対する脅威とみなされて怒りを引き起こした可能性があります。
Facebook と Instagram の親会社である Meta も、特に Simon & Schuster などの出版社から著作権で保護された要素を使用することを懸念していました。 同時に、著作権侵害に巻き込まれる可能性がある一般的な Web コンテンツの取得についても議論されました。
データ不足: 型破りなアプローチの推進
競争に満ちたデータ収集は、AI 技術の開発におけるデータの極めて重要な位置に注目し、それをdentするのに役立ちます。 AI に言語を組み込むことで、イギリス連邦を含むますます多くのトレーニング データセットが命令され、今日ではこれらのソースの外部から Wikipedia や Reddit に至るまで操作されています。 テクノロジー企業、特に従来のデータ ストアなどの非常に一般的なデータ ソースにアクセスすることが困難な企業にとって、AI を活用したモデルの作成は、そのような場合に十分望ましい代替ソリューションとなる可能性があります。
技術企業はAIトレーニングにデータ収集が必要であると主張しているが、同じプロセスが法的に問題となっている。 OpenAI、彼らの弁護において、著作権素材の不法使用に関する告訴で勝訴しました。 それでも、彼らは自分たちの行為はフェアユースの法原則の範囲内にあると述べた。 近年、著作権者が米国著作権局に提出した申請件数は1万件を超えており、AI時代の著作権法が独自かつ真新しいものであることは明らかだ。 その結果、主要プレーヤーは、これに基づいて AI を使用したモデルにはライセンス目的がないという名目で、多くの著作物の侵害に関連する危険に常に直面しています。
大規模なデータセットの必須事項
全体として、スケールの大きな科学者であるカイパンのデ・ジャレッド氏の研究は、AI 開発において意図せずして壮大なものとなっています。 データドリブン コンテンツはトレーニング プロセスに必要な AI コンポーネントの 1 つですが、適切にトレーニングされ効果的に動作するモデルがなければ適切に機能しません。 人工知能テクノロジーの増加に伴い、市場で成功するためのデータへの需要が急速に高まり、企業は法律、倫理、プライバシーに関する疑問を抱えています。 したがって、人工知能アルゴリズムが市場で成功するには、これらのデータセットを使用する必要があります。
AI の強化により、VIP のデータ収集動作が変更されています 典型的な方法論的な誓いは粗雑になりつつあります。 YouTube での講演や合成データ生成の作成を通じて、これらの企業は、法律、倫理、プライバシーの問題が実際に何であるかを発見するという使命を担うリーダーです。
後々海の上で笑い話になるかも知れません。 イノベーションのプロセスを推進するために必要な膨大なデータセットの出現により、社会のリーダーは建設的な対話に積極的に参加して、イノベーションの取り組みが知的財産権とプライバシーの倫理原則とバランスのとれたルールや基準を策定することが求められています。
元の記事はこちらから: https://www.nytimes.com/2024/04/06/technology/tech-giants-harvest-data-artificial-intelligence.html
Cryptopolitan Academy:2025年にあなたのお金を育てたいですか?今後のWebClassでDeFiでそれを行う方法を学びますあなたのスポットを救ってください