با ظهور تکنولوژی و بهخصوص هوش مصنوعی، دنیای هنر نیز تغییرات گستردهای کرده است. یکی از این هنرها، نقاشی است که در آن بهواسطهی هوش مصنوعی، تبدیل مستقیم خیال به تصاویر دیجیتال میسر شده است. مهمترین قدم را در این مسیر، هوش مصنوعی میدجرنی (Midjourney AI) برداشته است. این تکنولوژی درحقیقت توصیف آنچه قرار است کشیده شود را بهصورت متنی دریافت کرده و تبدیل به تصویر میکند.
اما سازوکار هوش مصنوعی میدجرنی یا میدجورنی چیست؟ چه المانهایی دارد؟ چطور میتوان از آن استفاده کرد؟ اینها سوالاتی هستند که در این مقاله به آنها پاسخ خواهیم داد. با ما همراه شده و با یکی از آخرین دستاوردهای تکنولوژی با تاثیر مستقیم بر دنیای هنر، سرگرمی و محتوای دیجیتال آشنا شوید.
فهرست محتوا
Toggleهوش مصنوعی میدجرنی چیست؟
از نظر تکنیکی، هوش مصنوعی Midjourney نوعی هوش مصنوعی مولد یا Generative AI است که میتواند المانهای زبان طبیعی یا انسانی را به تصویر تبدیل کند. نمونههای متفاوتی از این تکنولوژی تولید شدهاند که ازآنجمله میتوان به DALL-E، Stable و Diffusion اشاره کرد. بااینحال میدجرنی تقریبا معروفترین و کاملترین آنهاست.
هوش مصنوعی میدجرنی بدون نیاز به سختافزار و نرمافزار خاص و تنها از طریق برنامهی چت Discord قابل استفاده است. از مزایای این تکنولوژی میتوان به کیفیت بالا، سهولت استفاده، سرعت بالا، دقت و عدم نیاز به توضیحات زیاد اشاره کرد. برای استفاده از آن باید یکی از طرحهای آن را خریداری کنید چراکه این برنامه، نسخهی رایگان ندارد.
سازوکار میدجرنی چیست؟
اساس عملکرد میدجرنی مانند هر تکنولوژی هوش مصنوعی دیگر، بر پایهی الگوریتمهای یادگیری ماشینی یا Machine Learning است. هدف این الگوریتمها آموزش ماشینها به نحوی است که در برخورد با موقعیتها و سوالات، پاسخهایی انسانگونه داشته باشند. این الگوریتمها با اطلاعات ابتدایی تغذیه شده و پاسخهایشان نظارت و اصلاح میشود. فرآیندهایی که میتوانند با یا بدون دخالت انسان انجام شوند.
هوش مصنوعی میدجرنی همچنین از مدلهای انتشار (Diffusion Models) استفاده میکند. هدف این مدلها، کشف و یادگیری ساختارهای پنهان در مجموعهای از دادههاست. درحقیقت، یک مدل انتشار، نوعی یادگیری ماشینی است که فرآیند یادگیریاش را از طریق مدلسازی پیش میبرد. این مدلها همچنین به تولید تصاویر باکیفیت بدون محوشدگی، نویز و سوختگی کمک میکنند.
میدجرنی هم مانند گوگل بارد و ChatGPT از یک مدل زبانی بزرگ (Large Language Model) برای درک آنچه کاربر نوشتهاست استفاده میکند. این ماشین، سپس متون را به بردار یا یک نسخهی عددی از متن نوشتهشده تبدیل کرده و پس از فرآیند پیچیدهی انتشار یا Diffusion، آن را به تصویر میکشد.
از نظر کاربر، فرآیند تبدیل متن به تصویر در میدجرنی بهصورت زیر طی میشود:
- وارد کردن توصیف تصویر مانند گاو سفید در مزرعهی گندم یا زامبیها در جنگ بین سیارهای
- نمایش میدانی از نویز غیرواضح و بیمعنی بر روی صفحهنمایش
شکلگیری رفتهرفتهی تصویر با حذف نویزهای اضافه که بهطور متوسط یک الی دو دقیقه طول میکشد. (این مرحله توسط مدل انتشار انجام میشود)
تاریخچه میدجرنی
میدجرنی برخلاف بسیاری از رقبایش مانند DALL-E که توسط OpenAI، خالق Chat GPT پشتیبانی میشود، یک پروژهی مستقل است. در وبسایت این پروژه میخوانیم که سرمایهی توسعهی آن تماما توسط توسعهدهندههایش تامین شده و بودجهای از منابع خارجی دریافت نکرده است. این برنامه، توسط یک آزمایشگاه تحقیقاتی هوش مصنوعی در سانفرانسیسکو هدایت میشود.
درحالحاضر نسخهی V5 میدجرنی در دسترس عموم قرار دارد که در ابتدای ژوئن ۲۰۲۳ روانهی بازار شده است. ادغام این برنامه با نسخه V4 با سرورهای دیسکورد در تاریخ ۱۴ مارس سال ۲۰۲۲ صورت گرفت. نسخهی V5 در مقایسه با نسخههای قبلی، دانش بیشتری از موجودات، اشیاء و مکانها دارد. دیوید هولز (David Holz)؛ از مدیران سابق Leap Motion؛ شرکت معروف حوزهی واقعیت افزوده و واقعیت مجازی؛ رهبری میدجرنی را برعهده دارد.
روش استفاده از Midjouney چیست؟
برای استفاده از میدجرنی باید مراحل زیر را دنبال کنید:
- ساختن اکانت دیسکورد در وبسایت com
- پیوستن به سرور میدجرنی دیسکورد با Accept کردن قسمت Join to Midjourney در حساب دیسکورد
- دسترسی کانالها. در حساب خود در دیسکورد Channel هایی با نام Newbies را انتخاب کنید. این کانالها، مخصوص دریافت دستور از کاربران تازه هستند.
- ارائهی دستور. دستور متنیتان را در کانال Newbies خود پس از نوشتن عبارت”/imagine” تایپ کرده و منتظر اتمام فرآیند بمانید.
- انتخاب نتیجه. میدجرنی نسخههای متعددی را بهعنوان پاسخ ارائه میدهد که میتوانید از بین آنها یکی را انتخاب کنید.
- اصلاح نتیجه. میتوانید با استفاده از دکمهها و گزینههای ادیت موجود، تصویر انتخابی خود را اصلاح کنید
- ذخیرهی تصویر. برای ذخیرهی تصویر ابتدا باید آن را با استفاده از یک مرورگر وب مانند گوگل کروم باز کرده و سپس آن را save کنید.
نکتهی مهمی که هنگام کار با هوش مصنوعی میدجرنی باید در نظر داشته باشید، دقت و شفافیت کلماتی است که از آن استفاده میکنید. بهطورکلی هرچه با ماشینهای هوش مصنوعی واضحتر حرف بزنید، نتایج بهتری نیز خواهید گرفت. با مرور نظرات کاربران میدجرنی در شبکههای اجتماعی میبینیم که میزان رضایت آنها متفاوت است. برخی از آنها دریافت نتایج بیربط و غیرعادی و برخی دیگر، دریافت تصاویر خیرهکننده را گزارش کردهاند. کیفیت تصاویر و ظرافتهای آنها گاهی بهاندازهای بوده که تحسین عکاسان، نقاشان و گرافیستهای معروف را در بر داشته است.
هزینه استفاده از میدجرنی
برخلاف رباتهای چت Bing و ChatGPT استفاده از میدجورنی و دیگر تکنولوژیهای AI تولید تصویر، رایگان نیست. همانطورکه قبلا هم گفتیم، برای استفادهی کامل از میدجرنی باید یکی از طرحها یا پلانهای آن را خریداری کنید. دلیل اصلی این موضوع، منابع نرمافزاری و سختافزاری بسیاری است که سرورهای این نوع هوش مصنوعی از آنها استفاده میکنند. آنها به کارتهای گرافیک، منابع ذخیرهسازی و CPU های قدرتمندی برای ارائهی خدمات خود نیاز دارند که مستلزم صرف هزینه است. بدون طرحهای پولی، امکان دریافت تصاویر را نخواهید داشت.
برای اطلاع از سازوکار Bing AI مطالعهی مقالهی هوش مصنوعی بینگ چیست؟ را به شما پیشنهاد میکنیم.
بااینحال، بسیاری از رقبای میدجرنی، حداقل یک نسخهی رایگان با محدودیت در حجم استفاده یا امکانات را به کاربران خود ارائه میدهند. بههرحال در زمان نگارش این مقاله، یعنی اواسط ژوئن ۲۰۲۳، ارزانترین طرح استفاده از میدجرنی ۱۰ دلار در ماه است. با این طرح، امکان استفاده از این برنامه به مدت ۳٫۳ ساعت را خواهید داشت. در این بازهی زمانی حدودا، قادر به تولید حدود ۲۰۰ تصویر با کیفیت متوسط به بالا خواهید بود.
طرحهای گرانتر، میدجرنی امکان کاهش سرعت تولید تصویر را به کاربر میدهند که سبب افزایش کیفیت میشود. برخی از آنها محدودیت تعداد تصویر یا ساعت استفاده نیز ندارند. با صرف ۱۰ دقیقه وقت میتوانید مطمئن باشید که بهترین کیفیت ممکن را با توجه به پتانسیلهای میدجرنی دریافت کردهاید.
خصوصیات متمایزکننده میدجرنی
اما تصاویری که از میدجرنی دریافت میکنیم چه ویژگیهایی دارند؟ در ادامه به بررسی کمی و کیفی نتیجهی کار میدجرنی و دیگر ویزگیهای این برنامه میپردازیم.
کیفیت تصویر میدجرنی
یکی از مهمترین ویژگیهای هوش مصنوعی میدجرنی، کیفیت بالای تصاویرش است. این تصاویر تاحدامکان، واقعی و ساختارمند بوده و ازنظر رابطهی بین عناصر منطقی بهنظر میرسند. رزولوشن آنها نیز حداکثر ۱۰۲۴ در ۱۷۹۲ پیکسل است. برای دستیابی به این درجه از کیفیت، خرید طرحهای گرانتر ضروری است.
رابط کاربری ساده
استفاده از هوش مصنوعی میدجرنی نیازی به داشتن دانش کدنویسی ندارد. رابط کاربری این برنامه، بسیار ساده بوده و تنها به دستورات متنی نیاز دارد. درحقیقت از منظر کاربر، تفاوت چندانی بین این برنامه و محصولات چت متنی AI وجود ندارد.
امکانات ویرایشی
یکی از مهمترین مزایای میدجرنی، امکانات ویرایشی متعدد آن است. پس از دریافت تصویر، قادر خواهید بود آن را به شیوههای مختلفی مانند چرخش، کراپ، تغییرات رنگی و غیره ویرایش کنید. این امکان، نیاز به نرمافزارهای دیگر مانند فتوشاپ و غیره را تا حد خوبی کاهش میدهد.
جامعه بزرگ و فعال
میدجرنی از طریق شبکهی اجتماعی میزبان خود یعنی دیسکورد یک جامعهی فعال دارد که در آن کاربران میتوانند نظرات خود را با یکدیگر بهاشتراک بگذارند. این جامعه بهخصوص برای کاربران تازهکاری که با ظرفیتها و محدودیتهای میدجرنی آشنایی ندارند، مفید است؛ چراکه میتوانند سوالات خود را در آنجا مطرح کنند.
کپی رایت، نقطه ضعف اصلی میدجرنی
درحالحاضر میتوان گفت که مهمترین نقطهضعف میدجرنی، مسئلهی کپیرایت در آن است. تصاویر تولیدشده توسط شما میتوانند توسط دیگران استفاده شوند. البته آنها باید تغییراتی روی تصاویر بدهند یا آنها را بهنحوی ریمیکس کنند. بهخصوص اگر قصد استفادهی تجاری از تصاویر خود مانند فروش آنها بهصورت آثار NFT یا استفاده از آنها بهعنوان لوگوی خود را داشته باشید، این مسئله میتواند چالشبرانگیز باشد. بنابراین بهنظر میرسد تا برطرف شدن این مشکل، میدجرنی نتواند برای اهداف تجاری استفاده شود و کاربری آن در حد سرگرمی باقی بماند.
میدجرنی در آینده
میدجرنی، درحالحاضر در فاز V5 خود قرار دارد. بهگفتهی مدیران این پروژه و مطابق برنامههای اعلامشده، چندین فاز توسعهای دیگر نیز تا سالهای آینده پیش روی میدجرنی است. همچنین گفته میشود قرار است این تکنولوژی با شبکههای اجتماعی دیگری، مانند توییتر و Reddit نیز ادغام شود. بسیاری از کارشناسان عرصهی هنرهای دیجیتال نیز نقش میدجرنی و تکنولوژیهای مشابه آن در آینده این عرصهها را چشمگیر میخوانند. این در حالی است که بسیاری، هنوز بر اصالت هنر دست و ذهن انسان تاکید داشته و آن را خطری برای خلاقیت بشر میدانند. نظر شما دربارهی میدجرنی چیست؟ آیا تابهحال با آن کار کردهاید؟