テクノロジー大手が限界を押し広げて AI のデータ欲求を満たしている

By James Kinoti
更新日: 2024 年 4 月 6 日午後 12:39 UTC

3 分で読めます

507313

コンテンツ

1. OpenAI のウィスパーイニシアチブ: YouTube の会話のマイニング

2. データ不足: 型破りなアプローチの推進

3. 大規模なデータセットの必須事項

共有リンク：

この投稿では:

テクノロジー大手は AI データを収集するために物議を醸す方法に頼っています。
OpenAI は YouTube 動画を文字起こししており、Google と Meta は著作権で保護されたコンテンツの購入を検討しています。
AIによる膨大なデータセットの使用をめぐっては、法的および倫理的な議論が巻き起こっている。

OpenAI の取り組みの有無に関わらず、産業界に資金を提供する AI は、創造的ではあるが物議を醸すさまざまな方法で膨大な量のデジタルデータを収集または蓄積するなどのさまざまな手段で構成されており、自動化の能力と機能が増加していることは明らかです。特に、上記で概説した措置を講じる（つまり、法的制限や企業ポリシーを考慮する）などの措置を伴う取り組みは、AI システムのトレーニングに使用される相当量のデータに相当します。

OpenAI のウィスパーイニシアチブ: YouTube の会話のマイニング

私たちの Whisper の物語はちょうど昨年始まりました。第一級の英語テキストが圧倒的に不足しており、教育の提供に遅れが生じています。 Whisper は Google による次のステップでした。これは YouTube の対話の海を理解し、テキスト、つまりテキスト読み上げアプリケーションとして開発されました。 AI を活用したツール自体は、AI によって監査されて新しいテキスト (本質的には新しい会話) を生成する 100 万時間以上の YouTube 動画で構成されており、最先端の技術から生成された AI モデルのトレーニングに利用されています。 ChatGPT チャットボットの最新バージョンである GPT-4 まで。

一部の従業員は、OpenAI の Microsoft 映像が YouTube を全面的に盗用するものであると主張しましたが、盗作の倫理については依然として議論の余地がありました。さらに、一部の従業員は、YouTube の意図に正確に沿うことは不可能であることを認めました。同様に、AI モデルに供給するテキストコンテンツをtracするためにビデオをアルゴリズム的に処理する際に異議が得られたことは、ビデオ作成者の著作権に対する脅威とみなされて怒りを引き起こした可能性があります。

ドナルドトランプディナーの誇大宣伝を参照

Facebook と Instagram の親会社である Meta も、特に Simon & Schuster などの出版社から著作権で保護された要素を使用することを懸念していました。同時に、著作権侵害に巻き込まれる可能性がある一般的な Web コンテンツの取得についても議論されました。

データ不足: 型破りなアプローチの推進

競争に満ちたデータ収集は、AI 技術の開発におけるデータの極めて重要な位置に注目し、それをdentするのに役立ちます。 AI に言語を組み込むことで、イギリス連邦を含むますます多くのトレーニングデータセットが命令され、今日ではこれらのソースの外部から Wikipedia や Reddit に至るまで操作されています。テクノロジー企業、特に従来のデータストアなどの非常に一般的なデータソースにアクセスすることが困難な企業にとって、AI を活用したモデルの作成は、そのような場合に十分望ましい代替ソリューションとなる可能性があります。

技術企業はAIトレーニングにデータ収集が必要であると主張しているが、同じプロセスが法的に問題となっている。 OpenAI、彼らの弁護において、著作権素材の不法使用に関する告訴で勝訴しました。それでも、彼らは自分たちの行為はフェアユースの法原則の範囲内にあると述べた。近年、著作権者が米国著作権局に提出した申請件数は1万件を超えており、AI時代の著作権法が独自かつ真新しいものであることは明らかだ。その結果、主要プレーヤーは、これに基づいて AI を使用したモデルにはライセンス目的がないという名目で、多くの著作物の侵害に関連する危険に常に直面しています。

ゴールドとBitcoinを参照してください、ドルは困っていますか？

大規模なデータセットの必須事項

全体として、スケールの大きな科学者であるカイパンのデ・ジャレッド氏の研究は、AI 開発において意図せずして壮大なものとなっています。データドリブンコンテンツはトレーニングプロセスに必要な AI コンポーネントの 1 つですが、適切にトレーニングされ効果的に動作するモデルがなければ適切に機能しません。人工知能テクノロジーの増加に伴い、市場で成功するためのデータへの需要が急速に高まり、企業は法律、倫理、プライバシーに関する疑問を抱えています。したがって、人工知能アルゴリズムが市場で成功するには、これらのデータセットを使用する必要があります。

AI の強化により、VIP のデータ収集動作が変更されています典型的な方法論的な誓いは粗雑になりつつあります。 YouTube での講演や合成データ生成の作成を通じて、これらの企業は、法律、倫理、プライバシーの問題が実際に何であるかを発見するという使命を担うリーダーです。

後々海の上で笑い話になるかも知れません。イノベーションのプロセスを推進するために必要な膨大なデータセットの出現により、社会のリーダーは建設的な対話に積極的に参加して、イノベーションの取り組みが知的財産権とプライバシーの倫理原則とバランスのとれたルールや基準を策定することが求められています。

元の記事はこちらから: https://www.nytimes.com/2024/04/06/technology/tech-giants-harvest-data-artificial-intelligence.html

2025年にDeFiで受動的収入を得るための新しい方法。詳細については

共有リンク：

検索...

免責事項。 提供される情報は取引に関するアドバイスではありません。 Cryptopolitan.com は、このページで提供される情報に基づいて行われた投資に対して一切の責任を負いません。 dent調査や資格のある専門家への相談をtronします

よく読まれている

暗号通貨に関するニュースを常に把握し、毎日の最新情報を受信箱で受け取ります

編集者の選択

エディターズチョイスの記事を読み込んでいます...

テクノロジー大手が限界を押し広げて AI のデータ欲求を満たしている

コンテンツ

この投稿では:

OpenAI のウィスパーイニシアチブ: YouTube の会話のマイニング

データ不足: 型破りなアプローチの推進

大規模なデータセットの必須事項

共有リンク：

よく読まれている

暗号通貨に関するニュースを常に把握し、毎日の最新情報を受信箱で受け取ります

編集者の選択

サインアップしてトップを維持しましょう

市場は速く動きます。

より速く動きます。

入りましょう。事実を手に入れてください。
先に進んでください。

テクノロジー大手が限界を押し広げて AI のデータ欲求を満たしている

コンテンツ

この投稿では:

OpenAI のウィスパー イニシアチブ: YouTube の会話のマイニング

データ不足: 型破りなアプローチの推進

大規模なデータセットの必須事項

共有リンク：

よく読まれている

暗号通貨に関するニュースを常に把握し、毎日の最新情報を受信箱で受け取ります

編集者の選択

サインアップしてトップを維持しましょう

私たちに従ってください

- あなたを先に保つ暗号ニュースレター -

市場は速く動きます。

より速く動きます。

入りましょう。事実を手に入れてください。先に進んでください。

OpenAI のウィスパーイニシアチブ: YouTube の会話のマイニング

入りましょう。事実を手に入れてください。
先に進んでください。