معرفی مدل هوش مصنوعی تولیدکننده موسیقی متا

به گزارش فارس به نقل از انگجت، تیم تحقیقاتی متا به تازگی یک مدل زبان یادگیری عمیق منبع باز به نام «MusicGen» را منتشر کرده، که می‌تواند موسیقی جدیدی را بر اساس پیام‌های متنی تولید کند و حتی با یک آهنگ موجود تراز شود.

با استفاده از این ابزار می‌توانید سبک موسیقی مورد نظر را توضیح داده و سپس روی گزینه «Generate» کلیک کنید؛ پس از مدتی یک قطعه کوتاه از موسیقی کاملاً جدید را بر اساس پیام‌های متن و ملودی درخواستی شما منتشر می‌کند. نسخه نمایشی به شما امکان می دهد موسیقی خود را توصیف کنید. سپس می توانید انتخاب کنید که آهنگ چقدر طول بکشد.

این تیم از 20هزار ساعت موسیقی برای آموزش مدل استفاده کرد که شامل 10هزار آهنگ موسیقی با کیفیت بالا از مجموعه داده‌های داخلی به همراه آهنگ‌های شرکت های شاتراستاک و Pond5 بود. محققان برای سریع‌تر کردن آن، از واحدساز صوتی 32 کیلوهرتزی«EnCodec»متا جهت تولید قطعات کوچک‌تر موسیقی که می‌توانند به صورت موازی پردازش شوند، استفاده کردند.

گوگل ماه گذشته، یک تولید کننده موسیقی مشابه به نام«MusicLM» منتشر کرد، اما به نظر می رسد MusicGen نتایج بهتری ایجاد می کند.

همانطور که گفته شد، MusicGen منبع باز است و حتی می توان از آن برای تولید موسیقی تجاری استفاده کرد. با این حال، این آخرین نمونه از سرعت خیره کننده توسعه هوش مصنوعی در نیم سال گذشته است.