کشور چین از اولین مدل هوش مصنوعی تبدیل متن به ویدئو خود با نام Vidu رونمایی کرد. هوش مصنوعی Vidu می‌تواند ویدیویی با کیفیت بالا و مدت زمان ۱۶ ثانیه بسازد.

هوش مصنوعی Vidu می‌تواند رقیب خوبی برای هوش مصنوعی Sora که توسط شرکت OpenAI توسعه یافته است، باشد. این هوش مصنوعی کشور چین در انجمن Zhongguancun 2024 در شهر پکن رونمایی شد و رقابت هوش مصنوعی در سطح جهانی را وارد مرحله‌ی تازه‌ای کرد.

هوش مصنوعی Vidu که توسط شرکت چینی Shengshu Technology و با همکاری محققان دانشگاه چینهوا توسعه داده شده است، می‌تواند ویدیویی با کیفیت بالا به مدت ۱۶ ثانیه و وضوح ۱۰۸۰p تنها با یک کلیک خلق کند. به گفته‌ی این شرکت، این اولین مدل بزرگ ویدئویی کشور چین با مدت زمان طولانی، ثبات خوب و قابلیت‌های پویا است و به سطح هوش مصنوعی Sora بسیار نزدیک است.

هوش مصنوعی Sora یک مدل هوش مصنوعی مولد است که در اوایل سال جاری توسط شرکت OpenAI توسعه یافته است. این هوش مصنوعی با توانایی خود در ساخت صحنه‌های واقعی و تخیلی از دستورالعمل‌های متنی، نام شرکت OpenAI را بیش از پیش بر سر زبان‌ها انداخته است.

هوش مصنوعی Vidu برای تبدیل توضیحات متنی به ویدیوهای پویا و با کیفیت طراحی شده است. این مدل هوش مصنوعی متن به ویدیو، چیزی بیش از تفسیر بصری محتوا در سطح پایه انجام می‌دهد. این هوش مصنوعی می‌تواند با طیف کاملی از صحنه‌ها، شخصیت‌ها و اقدامات، بر اساس متن ورودی ویدئو ایجاد کند و ویدئوها را به طرز چشمگیری به واقعیت نزدیک کند.

طی یک نمایش زنده، هوش مصنوعی Vidu توانست فیزیک دنیای واقعی را تقلید کند و صحنه‌هایی را خلق کند که از قوانین فیزیک واقعی پیروی می‌کنند، از جمله افکت‌های نور، سایه‌های واقع گرایانه و حالات دقیق چهره‌هایی که بر اساس متن ورودی خلق شده بودند. علاوه بر این، این هوش مصنوعی می‌تواند عکس‌های متحرک پیچیده‌ای را به جای عکس‌های ایستا تولید کند و در مقایسه با هوش مصنوعی Sora، عناصر چینی مانند پاندا و اژدها را درک و تولید کند.

source
کلاس یوس

توسط petese.ir