الوکام در اینوتکس 1403
الوکام در اینوتکس 1403

میدجرنی چیست و چگونه با آن کار کنیم؟

هوش مصنوعی تصویر ساز میدجورنی

با ظهور تکنولوژی و به‌خصوص هوش مصنوعی، دنیای هنر نیز تغییرات گسترده‌ای کرده است. یکی از این هنرها، نقاشی است که در آن به‌واسطه‌ی هوش مصنوعی، تبدیل مستقیم خیال به تصاویر دیجیتال میسر شده است. مهم‌ترین قدم را در این مسیر، هوش مصنوعی میدجرنی (Midjourney AI) برداشته است. این تکنولوژی درحقیقت توصیف آنچه قرار است کشیده شود را به‌صورت متنی دریافت کرده و تبدیل به تصویر می‌کند.

اما سازوکار هوش مصنوعی میدجرنی یا میدجورنی چیست؟ چه المان‌هایی دارد؟ چطور می‌توان از آن استفاده کرد؟ اینها سوالاتی هستند که در این مقاله به آنها پاسخ خواهیم داد. با ما همراه شده و با یکی از آخرین دستاوردهای تکنولوژی با تاثیر مستقیم بر دنیای هنر، سرگرمی و محتوای دیجیتال آشنا شوید.

از نظر تکنیکی، هوش مصنوعی Midjourney نوعی هوش مصنوعی مولد یا Generative AI‌ است که می‌تواند المان‌های زبان طبیعی یا انسانی را به تصویر تبدیل کند. نمونه‌های متفاوتی از این تکنولوژی تولید شده‌اند که از‌آن‌جمله می‌توان به DALL-E، Stable و Diffusion اشاره کرد. بااین‌حال میدجرنی تقریبا معروف‌ترین و کامل‌ترین آنهاست.

هوش مصنوعی میدجرنی بدون نیاز به سخت‌افزار و نرم‌افزار خاص و تنها از طریق برنامه‌ی چت Discord قابل استفاده است. از مزایای این تکنولوژی می‌توان به کیفیت بالا، سهولت استفاده، سرعت بالا، دقت و عدم نیاز به توضیحات زیاد اشاره کرد. برای استفاده از آن باید یکی از طرح‌های آن را خریداری کنید چراکه این برنامه، نسخه‌ی رایگان ندارد.

سازوکار میدجرنی چیست؟

Midjourney چیست؟

اساس عملکرد میدجرنی مانند هر تکنولوژی هوش مصنوعی دیگر، بر پایه‌ی الگوریتم‌های یادگیری ماشینی یا Machine Learning است. هدف این الگوریتم‌ها آموزش ماشین‌ها به نحوی است که در برخورد با موقعیت‌ها و سوالات، پاسخ‌هایی انسان‌گونه داشته باشند. این الگوریتم‌ها با اطلاعات ابتدایی تغذیه شده و پاسخ‌هایشان نظارت و اصلاح می‌شود. فرآیندهایی که می‌توانند با یا بدون دخالت انسان انجام شوند.

هوش مصنوعی میدجرنی همچنین از مدل‌های انتشار (Diffusion Models) استفاده می‌کند. هدف این مدل‌ها، کشف و یادگیری ساختارهای پنهان در مجموعه‌ای از داده‌هاست. درحقیقت، یک مدل انتشار، نوعی یادگیری ماشینی است که فرآیند یادگیری‌اش را از طریق مدل‌سازی پیش می‌برد. این مدل‌ها همچنین به تولید تصاویر باکیفیت بدون محوشدگی، نویز و سوختگی کمک می‌کنند.

میدجرنی هم مانند گوگل بارد و ChatGPT از یک مدل زبانی بزرگ (Large Language Model) برای درک آنچه کاربر نوشته‌است استفاده می‌کند. این ماشین، سپس متون را به بردار یا یک نسخه‌ی عددی از متن نوشته‌شده تبدیل کرده و پس از فرآیند پیچیده‌ی انتشار یا Diffusion، آن را به تصویر می‌کشد.

از نظر کاربر، فرآیند تبدیل متن به تصویر در میدجرنی به‌صورت زیر طی می‌شود:

  • وارد کردن توصیف تصویر مانند گاو سفید در مزرعه‌ی گندم یا زامبی‌ها در جنگ بین سیاره‌ای
  • نمایش میدانی از نویز غیرواضح و بی‌معنی بر روی صفحه‌نمایش

شکل‌گیری رفته‌رفته‌ی تصویر با حذف نویزهای اضافه که به‌طور متوسط یک الی دو دقیقه طول می‌کشد. (این مرحله توسط مدل انتشار انجام می‌شود)

تاریخچه میدجرنی

میدجورنی

میدجرنی برخلاف بسیاری از رقبایش مانند DALL-E که توسط OpenAI، خالق Chat GPT پشتیبانی می‌شود، یک پروژه‌ی مستقل است. در وب‌سایت این پروژه می‌خوانیم که سرمایه‌ی توسعه‌ی آن تماما توسط توسعه‌دهنده‌هایش تامین شده و بودجه‌ای از منابع خارجی دریافت نکرده است. این برنامه، توسط یک آزمایشگاه تحقیقاتی هوش مصنوعی در سانفرانسیسکو هدایت می‌شود.

درحال‌حاضر نسخه‌ی V5 میدجرنی در دسترس عموم قرار دارد که در ابتدای ژوئن ۲۰۲۳ روانه‌ی بازار شده است. ادغام این برنامه با نسخه V4 با سرورهای دیسکورد در تاریخ ۱۴ مارس سال ۲۰۲۲ صورت گرفت. نسخه‌ی V5 در مقایسه با نسخه‌های قبلی، دانش بیشتری از موجودات، اشیاء و مکان‌ها دارد. دیوید هولز (David Holz)؛ از مدیران سابق Leap Motion؛ شرکت معروف حوزه‌ی واقعیت افزوده و واقعیت مجازی؛ رهبری میدجرنی را برعهده دارد.

روش استفاده از Midjouney چیست؟

میدجورنی چیست؟

برای استفاده از میدجرنی باید مراحل زیر را دنبال کنید:

  • ساختن اکانت دیسکورد در وب‌سایت com
  • پیوستن به سرور میدجرنی دیسکورد با Accept‌ کردن قسمت Join to Midjourney در حساب دیسکورد
  • دسترسی کانال‌ها. در حساب خود در دیسکورد Channel‌ هایی با نام Newbies را انتخاب کنید. این کانال‌ها، مخصوص دریافت دستور از کاربران تازه هستند.
  • ارائه‌ی دستور. دستور متنی‌تان را در کانال Newbies خود پس از نوشتن عبارت”/imagine” تایپ کرده و منتظر اتمام فرآیند بمانید.
  • انتخاب نتیجه. میدجرنی نسخه‌های متعددی را به‌عنوان پاسخ ارائه می‌دهد که می‌توانید از بین آنها یکی را انتخاب کنید.
  • اصلاح نتیجه. می‌توانید با استفاده از دکمه‌ها و گزینه‌های ادیت موجود، تصویر انتخابی خود را اصلاح کنید
  • ذخیره‌ی تصویر. برای ذخیره‌ی تصویر ابتدا باید آن را با استفاده از یک مرورگر وب مانند گوگل کروم باز کرده و سپس آن را save‌ کنید.

نکته‌ی مهمی که هنگام کار با هوش مصنوعی میدجرنی باید در نظر داشته باشید، دقت و شفافیت کلماتی است که از آن استفاده می‌کنید. به‌طورکلی هرچه با ماشین‌های هوش مصنوعی واضح‌تر حرف بزنید، نتایج بهتری نیز خواهید گرفت. با مرور نظرات کاربران میدجرنی در شبکه‌های اجتماعی می‌بینیم که میزان رضایت آنها متفاوت است. برخی از آنها دریافت نتایج بی‌ربط و غیرعادی و برخی دیگر، دریافت تصاویر خیره‌کننده را گزارش کرده‌اند. کیفیت تصاویر و ظرافت‌های آنها گاهی به‌اندازه‌ای بوده که تحسین عکاسان، نقاشان و گرافیست‌های معروف را در بر داشته است.

هزینه استفاده از میدجرنی

هوش مصنوعی میدجرنی

برخلاف ربات‌های چت Bing و ChatGPT استفاده از میدجورنی و دیگر تکنولوژی‌های AI تولید تصویر، رایگان نیست. همانطورکه قبلا هم گفتیم، برای استفاده‌ی کامل از میدجرنی باید یکی از طرح‌ها یا پلان‌های آن را خریداری کنید. دلیل اصلی این موضوع، منابع نرم‌افزاری و سخت‌افزاری بسیاری است که سرورهای این نوع هوش مصنوعی از آنها استفاده می‌کنند. آنها به کارت‌های گرافیک، منابع ذخیره‌سازی و CPU ‌های قدرتمندی برای ارائه‌ی خدمات خود نیاز دارند که مستلزم صرف هزینه است. بدون طرح‌های پولی، امکان دریافت تصاویر را نخواهید داشت.

برای اطلاع از سازوکار Bing AI مطالعه‌ی مقاله‌ی هوش مصنوعی بینگ چیست؟ را به شما پیشنهاد می‌کنیم.

بااین‌حال، بسیاری از رقبای میدجرنی، حداقل یک نسخه‌ی رایگان با محدودیت در حجم استفاده یا امکانات را به کاربران خود ارائه می‌دهند. به‌هرحال در زمان نگارش این مقاله، یعنی اواسط ژوئن ۲۰۲۳، ارزان‌ترین طرح استفاده از میدجرنی ۱۰ دلار در ماه است. با این طرح، امکان استفاده از این برنامه به مدت ۳٫۳ ساعت را خواهید داشت. در این بازه‌ی زمانی حدودا، قادر به تولید حدود ۲۰۰ تصویر با کیفیت متوسط به بالا خواهید بود.

طرح‌های گران‌تر، میدجرنی امکان کاهش سرعت تولید تصویر را به کاربر می‌دهند که سبب افزایش کیفیت می‌شود. برخی از آنها محدودیت تعداد تصویر یا ساعت استفاده نیز ندارند. با صرف ۱۰ دقیقه وقت می‌توانید مطمئن باشید که بهترین کیفیت ممکن را با توجه به پتانسیل‌های میدجرنی دریافت کرده‌اید.

خصوصیات متمایزکننده میدجرنی

کاربرد میدجرنی

اما تصاویری که از میدجرنی دریافت می‌کنیم چه ویژگی‌هایی دارند؟ در ادامه به بررسی کمی و کیفی نتیجه‌ی کار میدجرنی و دیگر ویزگی‌های این برنامه می‌پردازیم.

کیفیت تصویر میدجرنی

یکی از مهم‌ترین ویژگی‌های هوش مصنوعی میدجرنی، کیفیت بالای تصاویرش است. این تصاویر تاحدامکان، واقعی و ساختارمند بوده و ازنظر رابطه‌ی بین عناصر منطقی به‌نظر می‌رسند. رزولوشن آنها نیز حداکثر ۱۰۲۴ در ۱۷۹۲ پیکسل است. برای دستیابی به این درجه از کیفیت، خرید طرح‌های گران‌تر ضروری است.

رابط کاربری ساده

استفاده از هوش مصنوعی میدجرنی نیازی به داشتن دانش کدنویسی ندارد. رابط کاربری این برنامه، بسیار ساده بوده و تنها به دستورات متنی نیاز دارد. درحقیقت از منظر کاربر، تفاوت چندانی بین این برنامه و محصولات چت متنی AI وجود ندارد.

امکانات ویرایشی

یکی از مهم‌ترین مزایای میدجرنی، امکانات ویرایشی متعدد آن است. پس از دریافت تصویر، قادر خواهید بود آن را به شیوه‌های مختلفی مانند چرخش، کراپ، تغییرات رنگی و غیره ویرایش کنید. این امکان، نیاز به نرم‌افزارهای دیگر مانند فتوشاپ و غیره را تا حد خوبی کاهش می‌دهد.

جامعه بزرگ و فعال

میدجرنی از طریق شبکه‌ی اجتماعی میزبان خود یعنی دیسکورد یک جامعه‌ی فعال دارد که در آن کاربران می‌توانند نظرات خود را با یکدیگر به‌اشتراک بگذارند. این جامعه به‌خصوص برای کاربران تازه‌کاری که با ظرفیت‌ها و محدودیت‌های میدجرنی آشنایی ندارند، مفید است؛ چراکه می‌توانند سوالات خود را در آنجا مطرح کنند.

کپی رایت، نقطه ضعف اصلی میدجرنی

Midjourney

درحال‌حاضر می‌توان گفت که مهم‌ترین نقطه‌ضعف میدجرنی، مسئله‌ی کپی‌رایت در آن است. تصاویر تولیدشده توسط شما می‌توانند توسط دیگران استفاده شوند. البته آنها باید تغییراتی روی تصاویر بدهند یا آن‌ها را به‌نحوی ریمیکس کنند. به‌خصوص اگر قصد استفاده‌ی تجاری از تصاویر خود مانند فروش آنها به‌صورت آثار NFT یا استفاده از آنها به‌عنوان لوگوی خود را داشته باشید، این مسئله می‌تواند چالش‌برانگیز باشد. بنابراین به‌نظر می‌رسد تا برطرف شدن این مشکل، میدجرنی نتواند برای اهداف تجاری استفاده شود و کاربری آن در حد سرگرمی باقی بماند.

میدجرنی در آینده

میدجرنی، درحال‌حاضر در فاز V5 خود قرار دارد. به‌گفته‌ی مدیران این پروژه و مطابق برنامه‌های اعلام‌شده، چندین فاز توسعه‌ای دیگر نیز تا سال‌های آینده پیش روی میدجرنی است. همچنین گفته می‌شود قرار است این تکنولوژی با شبکه‌های اجتماعی دیگری، مانند توییتر و Reddit نیز ادغام شود. بسیاری از کارشناسان عرصه‌ی هنرهای دیجیتال نیز نقش میدجرنی و تکنولوژی‌های مشابه آن در آینده این عرصه‌ها را چشم‌گیر می‌خوانند. این در حالی است که بسیاری، هنوز بر اصالت هنر دست و ذهن انسان تاکید داشته و آن را خطری برای خلاقیت بشر می‌دانند. نظر شما درباره‌ی میدجرنی چیست؟ آیا تابه‌حال با آن کار کرده‌اید؟

4.5/5 - (34 امتیاز)

نظر خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

4 × سه =

مقالات مرتبط