"AUDIO"検索結果
06:18

Kimiは新しい汎用オーディオ基盤モデルKimi-Audioを発表しました

Jin10データ4月26日、今日、Kimiは新しいオープンソースプロジェクト——新しい汎用オーディオ基盤モデルKimi-Audioを発表しました。紹介によると、このモデルは音声認識、音声理解、音声からテキストへの変換、音声対話など多様なタスクをサポートしています。
もっと
AUDIO0.27%
03:22

Alibaba Tongyiのオープンソースオーディオ言語モデルであるQwen2-AudioがACL 2024に選ばれました

金十データ8月13日のニュースによると、アリババは通義大モデルを引き続きオープンソース化し、Qwen2シリーズオープンソースファミリーに音声言語モデルQwen2-Audioを追加しました。Qwen2-Audioはテキスト入力なしで直接音声での質問応答が可能で、ユーザーの音声信号(会話、自然音、音楽など)を理解し分析します。このモデルは複数の権威ある評価で以前の最高モデルを大幅に上回っています。通義チームはさらに新しいオーディオ理解モデルのベンチマークテストを同時に発表し、関連論文は今週開催されている国際会議ACL2024に採択されました。
AUDIO0.27%
  • 3
03:40
Pinwan氏によると、Arxivのページには、Alibabaが最近Qwen-Audioという音声言語モデルをリリースしたことが示されている。 このモデルは、音声言語の事前学習を拡張して、30以上のタスクと、人間の声、自然の音、音楽、歌などのさまざまな音声タイプをカバーすることで、普遍的な音声理解を実現するように設計されています。 調査によると、Qwen-Audioは、タスク固有の微調整を必要とせずに、幅広いベンチマークタスクで大幅なパフォーマンスを達成しています。
AUDIO0.27%
05:16
10月24日、タイム誌は、私たちの生活を変える200のイノベーションを含む「ベストインベンション2023」リストを発表しました。 その中から、AdobeのPhotoshopのGenerative ExpandとGenerative Fill、OpenAIのGPT-4とDall-E 3、Runway Gen-2、Meta SeamlessM4T、Stable Audioなど、AIの分野で合計14のプロジェクトが選ばれました。
13:49
TechCrunch によると、9 月 13 日、Stability AI は人工知能音楽ジェネレーターである Stable Audio の発売を発表しました。 Stable は、これが潜在拡散と呼ばれる技術を通じて商用目的で「高品質」の 44.1 kHz 音楽を作成できる最初のツールであると主張しています。スタビリティ氏は、オーディオ ファイルの長さと開始時間だけでなく、オーディオ メタデータをトレーニングすることにより、以前にリリースされた生成音楽ツールと比較して、Audio Diffusion の基礎となるモデルには約 12 億のパラメータがあり、オーディオのコンテンツとコンテンツを合成できると述べました。間隔。 1 年前、Stability AI はひっそりと Dance Diffusion をリリースしましたが、その後、Stability AI がモデルの作成に資金を提供した研究機関 Harmonai が Dance Diffusion の更新を停止しました。本日発売されたStable AudioはHarmonaiだけが開発したものではありません。 4 月に正式に立ち上げられた Stability のオーディオ チームは、Stable Audio の基礎として Dance Diffusion からインスピレーションを得た新しいモデルを作成し、その後 Harmonai によってトレーニングされました。現在、Stable Audio は Web アプリを通じてのみ利用できます。また、Stability は、Stable Audio の背後にあるモデルをオープンソースとしてリリースする計画も発表していません。
  • 1
19:36
キム・アーゼンドルフ: 催眠術をかけるために設計された NFT アートを作成するメタリカのビデオ ディレクター デジタル表現主義者でありインターネットアート出身のキム・アーゼンドルフは、最新のNFTドロップ「Colors of Noise」を明らかにしました。 Feral File プラットフォーム用に Peggy Schoenegge によってキュレーションされた、50 点のユニークなアートワークのシリーズは、それぞれ 0.25 ETH で入手できます。 Asendorf は、Web Audio API を使用してホワイト ノイズを生成し、アニメーションを作成することで、彼のキャリアで初めてビジュアル アートとオーディオ アートを組み合わせました。
もっと詳しく

最新のトピック

もっと

暗号資産カレンダー

もっと
プロジェクトの最新情報
BNB Chain 第十一季 MVB プログラムの申請は 9 月 6 日に締切となり、オフラインの駐在プログラムは 10 月 6 日から 12 月 5 日まで行われます。
2025-09-06
プロジェクトの最新情報
INFINITのINエアドロップ申請は9月6日18:00に締切となります。
2025-09-06
シアトルでのCIE-SEA 2025年年次大会
ArcBlockは、9月7日にCIE-SEA 2025年年次大会に参加し、BELLEFoundersイベントに参加します。CEOのRobert Maoは、AWS、Microsoft、その他のテクノロジーの巨人たちとともに、パネルディスカッションで分散型AIとデジタルアイデンティティに関する彼のビジョンを発表します。このイベントはシアトルで開催されます。
2025-09-06
ドラゴンバース シーズン22
MOBOXは、8月28日から9月7日08:00 UTCまで開催されるDragonverseイベントのシーズン22を開始しました。賞金プールには6,000 MBOX、1,000万 eMDBL、およびすべてのゲーム内購入の50%が含まれています。追加のアイテムドロップはMOBOXホルダー向けに利用可能で、トップ5の$MBOX支出者には独占ボーナス報酬が送られます。
2025-09-06
YouTubeでのライブストリーム
OriginTrailは、Microsoftとのコラボレーションにより、「AIエージェントによるエンタープライズインテリジェンスの解放」というウェビナーを9月8日16:00 UTCに開催します。このセッションでは、MicrosoftのCEOクリス・コールスラストとOriginTrailの共同創設者ブラナ・ラキッチが登壇し、MicrosoftとOriginTrailのノードとMCP技術がエンタープライズ向けの検証可能なAIソリューションの限界を押し広げている様子を示します。この議論は、MicrosoftのCEOサティア・ナデラの「SaaSは死んだ — 未来はAIエージェントである」という発言を背景にしています。
2025-09-07
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)