أصبح من السهل أكثر من أي وقت مضى تجربة فن الذكاء الاصطناعي بنفسك ، مع عدد من المولدات الفنية منخفضة التكلفة أو المجانية للذكاء الاصطناعي.
انتقل صانعو الفن بالذكاء الاصطناعي من حداثة إلى متخصصة إلى سلعة في أشهر فقط ، مع العديد من الخدمات التي تعد بالقدرة على إنشاء فن الذكاء الاصطناعي التوليدي على الفور باستخدام مطالبات نصية باللغة الطبيعية. تقدم أفضل الخدمات الفنية للذكاء الاصطناعي صورًا رائعة وأدوات فائقة الجودة ، إما مجانًا أو بسعر منخفض.
لماذا نستخدم فن الذكاء الاصطناعي؟ يمكن للكثير منا تقدير لوحة أو صورة أو رسم رائع ، دون القدرة على رسمها بأنفسنا. قد نتمكن أيضًا من وصف ما نريد رؤيته ، وهنا يأتي دور فن الذكاء الاصطناعي . بدلاً من البحث عن قطعة فنية تطابق هذا الوصف ، تقوم الخدمة بإنشائه بالفعل ، ومطابقة ما تعرفه عن المشاهد المصورة في قاعدة بيانات الصور الخاصة بها ومقارنتها بالمشهد والأسلوب الذي تحدده.
ومع ذلك ، فإن كل هذا التعقيد يتطلب موارد حوسبة مكثفة. تميل خدمات AI الفنية إلى التعامل مع هذا بطريقتين: إما تقييد الصور التي تم إنشاؤها (إما عدد الصور ، أو دقتها) أو تحصيل "أرصدة" منك أو أموال فعلية لتمكين المزيد من الاشتراكات. نحن نأخذ ذلك في الاعتبار.
أخيرًا ، لا يمكننا تجاهل الآثار القانونية والأخلاقية لفن الذكاء الاصطناعي. تم تدريب فن الذكاء الاصطناعي التوليدي على عدد كبير من الصور - بعضها عام ، وبعضها ربما يكون خاصًا - وتستخدم الخدمات ذلك باعتباره "بذرة" للصورة التي تنتجها. ليست كل خدمات الذكاء الاصطناعي شفافة بشأن مصدر صورها. تشعر شركات مثل Getty Images أن هذا غير قانوني ، وقد رفعت دعوى . ومع ذلك ، فإن الأصالة الفعلية لفن الذكاء الاصطناعي موضع نزاع ، ويلاحظ مؤيدو الذكاء الاصطناعي أنه حتى الفنانين البشر عادةً ما يتم تدريبهم أو تأثرهم بتعرضهم للفن الحالي ، سواء كان عامًا أو خاصًا. فقط اعلم أنك ربما لن "تمتلك" قطعة من فن الذكاء الاصطناعي دون بعض الأدلة على أنك قمت بتغييرها بنفسك لجعلها عملاً أصليًا.
مشوش؟ سنتحدث أكثر عن كيفية البدء في فن الذكاء الاصطناعي وبعض تفاصيل المصطلحات الفنية للذكاء الاصطناعي التي قد ترغب في معرفتها (مثل الرسم الداخلي) في نهاية هذه القصة.
أفضل المولدات الفنية للذكاء الاصطناعي
ميدجورني
- التكلفة: نسخة تجريبية مجانية (قيد الانتظار) / 10 دولارات / 30 دولارًا / 60 دولارًا شهريًا
- الصور: 25 مطالبة للإصدار التجريبي المجاني ، ثم يختلف
- ترخيص الصورة: الاستخدام غير التجاري للإصدار التجريبي المجاني ، وإلا يُسمح بالاستخدام التجاري باستثناء الشركات الكبيرة
- NSFW / المشاهير: لا / نعم
حتى الآن ، تبرز Midjourney كقائد لا مثيل له لفن الذكاء الاصطناعي منذ إطلاقه العام الماضي - على الرغم من أن روعة صوره تتناقض بشكل مثير للسخرية مع الثقل المطلق لواجهته. يقدم Midjourney v5 (الإصدار الحالي اعتبارًا من وقت النشر) نوعًا من الصور الواقعية الزائفة (مثل البابا في سترة منتفخة ) التي تولد قصصًا إخبارية. يمكن الآن إنشاء "الواقع" بشكل مصطنع.
تستخدم Midjourney Discord كواجهة لها لأن الشركة الناشئة لم ترغب في الاستثمار في أي بنية تحتية. ستحتاج إلى التسجيل للحصول على هذا التطبيق ، ثم الانتقال إلى إحدى قنوات Discord "للمبتدئين" واستخدم الأمر / imagine لدفع الخدمة بطلبك للحصول على فن AI. (إليك دليل لبدء استخدام Discord إذا كنت في حاجة إليه.) تتقاضى Midjourney ما لا يقل عن 10 دولارات شهريًا مقابل خطتها الأساسية ، مع مستويات إضافية مقابل 30 دولارًا شهريًا و 60 دولارًا شهريًا. قام Midjourney بتعليق الإصدار التجريبي المجاني . هناك طرق لشراء المزيد من الوقت حسب الطلب ، واستخدام وضع "استرخاء" أبطأ ، والمزيد.
يُنشئ كل موجه أربع صور ، يمكن اختيار أي منها من أجل "التباين" بالإضافة إلى الارتقاء بالمستوى. Inpainting ممكن أيضًا. يمكنك فتح الصورة إما في Discord أو في متصفح لتنزيلها. تقول Midjourney أنه يمكنك استخدام الصور التي تم إنشاؤها "بأي طريقة تريدها تقريبًا" ، والتي تتضمن ملكية تلك الصور ، وفقًا لشروط الخدمة الخاصة بها.
دعنا نكرر: صور Midjourney رائعة ، وبما أنها عامة ، يمكنك رؤية المستخدمين الآخرين يقومون بإنشاء الصور في الوقت الفعلي بالإضافة إلى تصفح معرض للصور التاريخية. يكمن سحر Midjourney في الطريقة التي يقدم بها عادةً صورة جيدة بشكل روتيني. لكن استخدامه يشبه إلى حد كبير إصدار سطر أوامر من Photoshop: هناك الكثير من التعديلات المتاحة ، وهي ليست واضحة على الإطلاق.
Microsoft Bing Chat (الوضع الإبداعي)
- التكلفة: مجانًا مع حساب Microsoft
- الصور: غير محدود على ما يبدو
- ترخيص الصورة: غير واضح
- NSFW / المشاهير: لا / البعض
عادةً ما نبرز Bing Image Creator كمساهمة في صورة الذكاء الاصطناعي من Microsoft. يعد Microsoft Designer المدعوم من AI ممتازًا أيضًا. لكن من الغريب أننا نحب Bing Chat (تحديدًا ، الوضع الإبداعي الخاص به) كأفضل منشئ فني للذكاء الاصطناعي لسبب واحد محدد: التكرارات.
جميع خدمات Microsoft الفنية الثلاثة للذكاء الاصطناعي مجانية بشكل أساسي وغير محدودة على ما يبدو ، بشرط أن يكون لديك حساب Microsoft وتمكنت من تجاوز قائمة انتظار Bing Chat و Image Creator. (يحتوي برنامج Image Creator على نظام "تعزيز" غريب قد يكون قيد التشغيل أو لا يعمل هنا ، ولكن يبدو أن Microsoft لا تضع علامة على أي قيود على عدد الصور التي يمكنك إنشاؤها ، وهو ما يمثل نقطة بيع ضخمة.) تدعي ملكية أي من الصور التي تنشئها ، لكنها لا تقول أيضًا أنك تملكها.
بخلاف ذلك ، كل ما عليك فعله هو الانتقال إلى Bing Chat وإدخال موجه مثل "ارسمني ..." متبوعًا بوصف للصورة. سيستغرق Bing بعد ذلك بضع لحظات وينشئ أربع صور بحجم 1،024 × 1،024 يمكنك النقر فوقها لتراها بشكل أكثر وضوحًا وتنزيلها. لن يجذب بنج مشاهير مثل بيل جيتس أو دونالد ترامب ، لكن براد بيت بخير على ما يبدو.
تستخدم Microsoft نسخة مدربة من نموذج DALL-E 2 ، والنتائج ، بشكل شخصي ، مجرد خطوة أقل من Midjourney. لا يبدو أن Bing Chat تسمح بالرسم ، يمكنك القيام بشيء لا يفعله كل منشئي فنون الذكاء الاصطناعي الآخرين: التكرار التدريجي في المشهد. ونعني بذلك أنه يمكننا حثه على: "رسم سلة فاكهة" ثم ، في الموجه التالي ، اطلب منه تعديل تفاصيل المشهد. (لن يقوم بتحرير المشهد ، ومع ذلك ، فقط قم بتنزيل صورة أخرى.)
ما لا يبدو أن Bing Chat يقوم به هو أرشفة الصور. ستحتاج إلى تنزيلها على الفور (هيه) أو زيارة Bing Image Creator ، حيث ستجدها مخفية.
ملعب AI
- التكلفة: مجاني / 15 دولارًا لكل شهر.
- الصور: 1،000 يوميًا (مجانًا) / 2،000 يوميًا (مدفوعة)
- ترخيص الصور: أنت تمتلكها ، حتى للاستخدام التجاري
- NSFW / المشاهير: لا / نعم
على الرغم من أن Microsoft Bing Chat ربما يفوز من حيث بساطته المطلقة ، فإن Playground AI هو على الأرجح أرخص وأبسط طريقة وأكثرها شمولاً لتجربة فن الذكاء الاصطناعي بنفسك. مع عدم وجود أكثر من حساب Google ، يمكنك الاشتراك في Playground و 1000 صورة مجانية يوميًا. (بعض تفاصيل الجودة والحجم محدودة بعد 50 صورة يوميًا.)
تم تصميم واجهة مستخدم Playground بشكل جيد للغاية ، مع معلومات وأنماط سريعة على السكة اليسرى ، مع تغيير الحجم والوزن والتعديلات الأخرى على اليمين. الصور التي تم إنشاؤها ليست جيدة تمامًا مثل Bing أو Midjourney ، لكنها خطوة صغيرة جدًا ، إذا كان الأمر كذلك. حول القيد الوحيد هي النماذج المتاحة: فقط Stable Diffusion 1.5 و 2.1 ، والتي ستكون كافية لكثير من الناس. (يكلف الوصول إلى DALL-E 2 مبلغًا إضافيًا قدره 10 دولارات شهريًا.) يمكنك التلاعب بصور المشاهير إذا كان هذا هو الشيء الذي تفضله ، لكن صور NSFW ليست كذلك.
على الرغم من ذلك ، فإن موقع Playground يضيء في عملية التحرير. مثل Bing ، يمكنك تحرير الصور التي تم إنشاؤها من خلال مطالبات إضافية ، سواء كان الأمر برمته أو مجرد جزء (inpainting). يسمي موقع Playground هذا Canvas ، وهي ميزة تجريبية تحتاج إلى بعض العمل - الانتقال من الإنشاء إلى التحرير (عبر المطالبة) إلى التحرير (عبر الطلاء الداخلي والخارجي) أصعب مما يجب أن يكون. خلاف ذلك ، تقدم هذه الخدمة حقًا.
مارك هاتشمان / آي دي جي
أدوبي فايرفلاي
- التكلفة: يحدد لاحقًا
- الصور: غير محدودة ، على الأقل في مرحلة تجريبية
- ترخيص الصورة: الاستخدام غير التجاري فقط أثناء الاستخدام التجريبي
- NSFW / المشاهير: لا / لا
تعد Adobe لاعبًا رئيسيًا في التصميم الإبداعي ، لذا فمن المنطقي أن تتضمن جميع أدواتها الذكاء الاصطناعي إلى حد ما. يمثل Adobe Firefly أولى خطوات Adobe العامة في هذا الاتجاه. حاليًا ، في مرحلة تجريبية ، تم إنشاء Firefly على صور خالية من حقوق الطبع والنشر أو مرخصة بشكل علني ، أو الصور التي يمتلكها هو نفسه. ربما لهذا السبب ، تبدو صور Firefly احترافية - ربما تكون دورة تحقق ذاتها ، نظرًا لأنك ربما رأيت العديد من الصور التي تم إنشاؤها في الأصل من أدوات Adobe ومخزون Adobe.
في الوقت الحالي ، لا نعرف ما الذي ستفرضه Adobe في النهاية على Firefly ، أو ما إذا كان منتجًا مستقلاً. كنا نتوقع أن يهبط محرك Firefly ، على الأقل ، في Photoshop وأدوات Adobe الأخرى. يقدم الإصدار التجريبي حاليًا قدرًا غير محدود من الأعمال الفنية من نص إلى صورة بالإضافة إلى تأثيرات النص ، أو الزخارف التي تم إنشاؤها بواسطة AI المطبقة على النص عبر مطالبة. تقول Adobe أيضًا إنها "تستكشف" الرسم الداخلي ، والتلوين الخارجي ، وتحويل النماذج ثلاثية الأبعاد إلى صور ، ونماذج الذكاء الاصطناعي المخصصة ، والرسم على الصورة ، والمزيد.
لا يبدو نموذج Adobe مجانيًا بشكل إبداعي مثل البعض الآخر ، ولكنه يعوضه بمظهره الاحترافي الأنيق. ينشئ كل موجه أربع صور ، والتي يمكنك ضبطها باستخدام تعديلات أسلوب سهلة التحليل من نوع المحتوى (صورة ، رسم ، فن) إلى الأنماط (ورق متعدد الطبقات ، وفراء ، ونيون ، وسكين لوح الألوان) إلى اللون ، ودرجة اللون ، والإضاءة. يؤدي ضبط تنسيق الصورة إلى تغيير الصورة أيضًا. فقط ننسى أي شيء NSFW أو المشاهير بداخله.
يبدو أن Adobe Firefly يعمل بشكل أفضل مع الصور التي لها صلة ما بالعالم الحقيقي وصور المخزون الخاصة به. الوصلات الغريبة ("ذبابة تطير حول رأس الملك") تنتج رؤى مذهلة لجزء واحد فقط من المشهد. سيحب المحترفون Firefly ، والذي سيكون بلا شك مقفلًا وراء اشتراك Creative Cloud باهظ الثمن.
انتشار مستقر
- التكلفة: مجاني
- الصور: غير محدود
- ترخيص الصورة: غير واضح
- NSFW / المشاهير: نعم / نعم
على عكس الخدمات الفنية للذكاء الاصطناعي المستندة إلى السحابة ، فإن نقطة البيع الرئيسية لـ Stable Diffusion هي أنها تعمل محليًا ، على جهاز الكمبيوتر الخاص بك - وليس على خادم! إذا كنت ترغب في إنشاء العشرات من صور الجان الذين يرتدون البكيني وهم يسبحون في برك من الجيلي في Midjourney ، فسيكون العالم قادرًا على الرؤية. خلاف ذلك ، إذا كان لديك كمبيوتر محمول أو سطح مكتب قوي للألعاب ، فيمكنك تنزيل كود Stable Diffusion ومجموعة متنوعة من نماذج الصور وبيانات التدريب والانتقال إلى المدينة على خصوصية جهاز الكمبيوتر الخاص بك. وكل ذلك مجانًا ، بشرط أن يكون لديك الوقت لتنزيل نموذج برنامج متعدد الجيجابايت ، وموارد الأجهزة لتشغيله ، والصبر لإعداده بالكامل.
يمكن أن يكون الانتشار المستقر يشبه إلى حد ما تشغيل Linux. إرثه هو سطر الأوامر ، وهناك الكثير من الأكواد المتاحة للجمهور على GitHub وما إلى ذلك لتلعب بها ، إذا كان هذا هو الشيء الذي تفضله. ومع ذلك ، أصبحت عمليات التنفيذ المستندة إلى UI لـ Stable Diffusion أكثر شيوعًا ، ويبدو أن الأكثر شيوعًا في الوقت الحالي هو AUTOMATIC1111 .
بطبيعة الحال ، كلما زادت قوة الأجهزة ، كان ذلك أفضل - ولكن ليس فقط وحدة المعالجة المركزية الخاصة بك أو حتى وحدة معالجة الرسومات الخاصة بك هي المهمة. بدلاً من ذلك ، يبدو أن المكون الرئيسي هو VRAM المتاحة لوحدة معالجة الرسومات الخاصة بك. هناك نماذج وأدوات تبديل وخيارات أخرى لتعديل Stable Diffusion لصالح وحدة المعالجة المركزية أو وحدات معالجة الرسومات ذات المستوى الأدنى ، ولكن أسهل طريقة لتشغيل Stable Diffusion هي باستخدام جهاز كمبيوتر قوي.
الحشد المستقر (Artbot)
- التكلفة: مجاني
- الصور: غير محدودة ، رغم أنها تخضع للاصطفاف
- ترخيص الصورة: غير واضح
- NSFW / المشاهير: نعم / نعم
إذن ماذا يحدث إذا لم يكن لديك جهاز كمبيوتر قوي بما يكفي لتشغيل Stable Diffusion؟ الحشد المستقر هو إجابة واحدة. مثل المدرسة القديمة (التي انتهت صلاحيتها الآن) SETI @ Home ، كل ما تفعله هو إرسال موجهك إلى مجموعة من أجهزة الكمبيوتر المتصلة التي تشغل Stable Diffusion. هناك عدد قليل من الواجهات الأمامية ، لكننا نعتمد على Artbot .
على عكس جذور Stable Diffusion ، يستخدم Artbot واجهة المستخدم الرسومية التي يمكن التنقل فيها إلى حد ما: موجه في الجزء العلوي ، متبوعًا بعدد كبير من الخيارات والنماذج المتاحة. ما يقدمه Artbot هو تلميحات أدوات مفيدة تشرح ما تفعله هذه الخيارات: كيف يؤثر ترجيح الموجه عليه ، والمطالبة السلبية ، والمزيد. هناك قائمة مفيدة للغاية للنماذج المختلفة التي يمكنك استخدامها كإطار عمل للمطالبة ، توضح لك بصريًا كيف ستؤثر على أسلوب الإخراج. التكوين مذهل.
ومع ذلك ، فإن الحشد المستقر ليس مجانيًا حقًا. إنه يعمل على نظام "kudos" ، حيث ستحتاج إلى التسجيل باستخدام مفتاح API - وهو عقبة أمام المستخدمين غير المألوفين. بعد ذلك ، ستبدأ بميزان التنويه ، والذي يتم طرحه مع كل صورة تقوم بإنشائها. وكلما كانت الصورة أكثر تعقيدًا ، زاد استهلاكها للشهرة. كلما قل عدد التنويهات ، كلما عدت في قائمة الانتظار مع مستخدمين آخرين. هذه ليست مشكلة دائمًا - فمع وجود 30 جهاز كمبيوتر أو نحو ذلك تعمل جميعها معًا لإنتاج الصور ، قد تجد أن صورتك قد تم إنشاؤها على الفور. (يتم حفظ الصور في مكتبة على الموقع حتى تقوم بمسح ملفات تعريف الارتباط الخاصة بك.)
ومع ذلك ، يمكنك "شراء" شهرة من خلال تصنيف الصور ، أو تدريب النموذج الذي تفضله الصور التي يفضلها البشر (أنت) أو توصيل جهاز الكمبيوتر الخاص بك بالحشد نفسه. بينما يمكنك الدخول في "الديون" عن طريق إنشاء صور بشكل متكرر ، إلا أن هناك بعض الإجراءات التي لا يمكنك اتخاذها بدون "رصيد" مجد فعلي لتمويلها.
لماذا تستخدم Artbot؟ العدد الهائل من نماذج الذكاء الاصطناعي ، والتباين في الأسلوب الذي تنتجه تلك الصور. بخلاف ذلك ، يمكن أن يكون إنشاء الصور عبر Artbot أمرًا صعبًا بعض الشيء ، وقد تنفق عددًا كبيرًا من الشهرة بمجرد استكشاف جميع الخيارات. نظرًا لعدم وجود إعداد حقيقي إلى جانب اكتشاف مفتاح API ، يمكن أن يكون Stable Horde (Artbot) يستحق المحاولة.
الوصيف: DALL-E و Mage.Space و Getimg.ai و DreamStudio AI
تبرز أربع خدمات فنية للذكاء الاصطناعي ولكنها لا تصنع قائمتنا: Dall-E الخاص بـ OpenAI و Mage.Space و DreamStudio و Getimg.ai.
لقد كتبنا عن DALL-E مؤخرًا ، وبعض الأجيال الفنية الشبيهة بالصور ممتازة. يبدو أن OpenAI ليس جادًا جدًا بشأنه ، على الرغم من ذلك ، ونموذج التسعير (115 صورة مقابل 15 دولارًا) لا معنى له. يتم تدريب صور Bing Chat المجانية على DALL-E أيضًا.
يتمتع Mage.Space بسمعة طيبة في جو شبيه بجو NSFW ، لكن الموقع تخلص من كل ذلك تدريجيًا مؤخرًا. ومع ذلك ، فقد ترك ما يشير إليه على أنه كمية غير محدودة تمامًا من الصور مجانًا. (تكلف أجيال NSFW 4 دولارات شهريًا ، ويرجع ذلك جزئيًا إلى أن بطاقات الائتمان يمكن أن تكون شكلاً من أشكال التعريف.) يحتوي الموقع على ما يبدو لأكثر من 40 طرازًا من طرازات التوليد المضبوطة اللطيفة للغاية ، ولكن تلك مخصصة لخطة Pro 15 دولارًا / شهرًا.
مارك هاتشمان / آي دي جي
يقدم Getimg.ai أيضًا مجموعة متنوعة ممتازة من النماذج التي يمكن من خلالها إنشاء الصور والتحرير الفوري وحتى DreamBooth ، والذي يسمح لك بتدريب نموذج على صورك الخاصة. ينفذ Getimg.ai أيضًا ControlNet لتوليد صورة إلى صورة ، وهي خوارزمية تحافظ على وجه التحديد على خصائص الصورة الأصلية (مثل الوضع) في إنشاء صورة إلى صورة. ومع ذلك ، فإن الحد الأقصى من 100 صورة مجانية شهريًا يبدو ضئيلًا للغاية ، على الرغم من أن الاشتراك 12 دولارًا / شهرًا يكسبك 3000 صورة شهريًا ، ورفع المستوى ، والوصول إلى نماذج التصوير.
لقد أمضيت الكثير من الوقت مع DreamStudio AI (الذي قدم لنا أرصدة لتجربتها) لكنه يبدو محدودًا للغاية (ولا يزال إصدارًا تجريبيًا؟) في الوقت الحالي. تشتري لك الرسوم الثابتة البالغة 10 دولارات أرصدة كافية لـ 5000 صورة ، ولكن لا يوجد سوى عدد قليل من النماذج ، لا يوجد تحرير ، وصور لا تبرز.
لأسباب مختلفة ، استبعدنا Deep Dream Generator و Starry.ai و NightCafe و Craiyon ، والتي تحولت إلى بحر من الإعلانات.
كيف تبدأ مع فن الذكاء الاصطناعي: الأساسيات
إذا كنت مهتمًا بتجربة فن الذكاء الاصطناعي ، فتذكر أن هناك الكثير من المواقع التي ستتيح لك تجربة فن الذكاء الاصطناعي مجانًا - ويجب عليك ذلك. يبدو أن حساب Google هو المطلب الافتراضي ، لأن الكثيرين لا يقدمون حتى القدرة على اختيار اسم مستخدم وكلمة مرور.
ستبدو أجيال قليلة من فن الذكاء الاصطناعي مثالية في المحاولة الأولى. ما تفعله مواقع مثل Midjourney هو مساعدة المستخدمين الجدد. يمكنك الحصول على نتيجة رائعة بمجرد وصف أساسي للغاية.
ولكن ، مثل أي هواية ، فإن فن الذكاء الاصطناعي له مهووسون به. ستشير بعض المواقع إلى (وحتى تقدم دروسًا تعليمية حول) "الهندسة السريعة" ، أو تخصيص موجه النص الخاص بك للحصول على النتيجة تمامًا. ما تقدمه المواقع الأخرى كبديل هو قائمة مرئية بسيطة بالأنماط والنماذج التي يمكنك الاختيار من بينها - وسيضيف تحديدها النص المناسب إلى الموجه نفسه. (قد يكون من المفيد أن نفهم كيف يختلف synthwave عن cyberpunk!) بعض ، للأسف ، يقفل هذه الطرز الإضافية خلف جدار حماية.
إذا كنت فجأة في حيرة من أمر ما تصنعه ، ففكر في التعديلات على العالم الحقيقي: تنين يطفو على جسر بروكلين. القنطور اللطيف في نهاية البار. ستتمتع بمزيد من المرح مع تصوير المشاهد بأنماط الفنانين أو المصورين المفضلين لديك. الكلمات مهمة ، وكذلك الصياغة! في بعض الأحيان قد يساء تفسير عبارة مثل "أثناء التزلج" ، ولكن "ركوب لوح التزلج" قد لا يكون كذلك.
يمكنك غالبًا إنشاء أكثر من صورة واحدة في كل مرة ، على الرغم من أن ذلك سيكلفك غالبًا من حيث الاعتمادات أو أيًا كان ما يستخدمه الموقع للحد من الأجيال. غالبًا ما تتطلب الصور الأكبر حجمًا مزيدًا من الائتمانات ، ولكن هذا يختلف حسب الخدمة.
فكر في موجه بهذه الطريقة: "صورة / فكاهي / نقش خشبي لسنجاب / مارلين مونرو / جنية بأسلوب فان جوخ / أنسيل آدامز / سلفادور دالي" ، حيث تختار واحدة من كل واحدة. ثم أضف أي مُعدِّلات تخطر ببالك: هل يُنظر إلى المشهد من خلال أغصان الشجرة؟ هل التقطت بكاميرا كانون DSLR بعدسة طويلة؟ يمكن أن يستوعب الذكاء الاصطناعي أكثر مما تعتقد.
حسنًا ، كل شيء تقريبًا. يحتوي فن الذكاء الاصطناعي أيضًا على نقطة ضعف واحدة: اليدين والأصابع. لماذا؟ لسنا متأكدين ، لكنها نقطة ضعف شائعة لدرجة أنها تكاد تكون ميم! تسمح بعض شروط الخدمة أيضًا بصور NSFW ، بينما لا تسمح أخرى - عندما تفكر في كل الأشياء الفظيعة التي يمكن للناس تخيلها ، يكون هذا منطقيًا. لا يهتم الآخرون بالسماح بتشابهات المشاهير ، مثل الرؤساء السابقين.
تمامًا مثلما يحتاج شخص ماهر في Photoshop أو Lightroom إلى وقت لتحرير صورة ، يمكنك ذلك أيضًا. قد تحتاج إلى بضع عشرات من الجهود للحصول على الأشياء تمامًا - ولهذا السبب يستحق تجربة فن الذكاء الاصطناعي على موقع يتيح مطالبات متعددة ، بسعر رخيص ، لمعرفة ما إذا كان الأمر يستحق ذلك. جرب مواقع متعددة أيضًا! يمكن أن تساعد أدوات التحرير الإضافية مثل inpainting و outpainting في إصلاح الأخطاء.
نعم ، inpainting. لا أعرف ماذا يعني ذلك؟ لم يفعل الكثير منا حتى وقت قريب جدًا. لقد قمنا بتضمين مسرد ، أدناه ، لتوفير تعريفات فنية إضافية للذكاء الاصطناعي لمساعدتك على البدء.
- موجه: وصف نصي بسيط (أو معقد!) يصف صورة الصورة. يتأثر هذا بالوزن الفوري (انظر أدناه).
- txt2img (نص إلى صورة) : هذا هو ما نفكر فيه بشكل أساسي فيما يتعلق بفن الذكاء الاصطناعي: إدخال موجه نص ، وإنشاء صورة.
- موجه سلبي : أي شيء لا تريد رؤيته في الصورة النهائية.
- img2img: (صورة إلى صورة ): بدلاً من إنشاء مشهد من البداية ، يمكنك تحميل صورة واستخدامها كمصدر إلهام للصورة الناتجة. هل تريد تحويل كلبك إلى ملك؟ قم بتحميل صورة الكلب ، ثم قم بتطبيق الجيل الفني من الذكاء الاصطناعي على المشهد.
- الموديل: يستخدم الذكاء الاصطناعي نماذج إنتاجية مختلفة (يعد Stable Diffusion 1.5 أو 2.1 الأكثر شيوعًا ، على الرغم من وجود العديد من النماذج الأخرى مثل DALL-E 2 ونموذج Midjourney المخصص) وسيضفي كل نموذج "مظهره" الخاص على المشهد. جرب وانظر ما الذي ينجح!
- الوزن الفوري: مدى تقارب النموذج والصورة مع الموجه. هذا متغير واحد قد ترغب في تعديله على المواقع التي تسمح بذلك. ببساطة ، لن يسمح الوزن السريع القوي بإبداع خوارزمية الذكاء الاصطناعي كثيرًا ، في حين أن الوزن الضعيف سيسمح بذلك.
- Sampler: لا يوجد شيء ربما تحتاج إلى القلق بشأنه ، على الرغم من أن عينات العينات المختلفة تؤثر أيضًا على مظهر الصورة.
- الخطوات: كم عدد التكرارات التي سيتخذها منشئ الفن بالذكاء الاصطناعي لإنشاء صورة ، مما يؤدي عمومًا إلى تحسين الإخراج. بينما تسمح لك العديد من الخدمات بتعديل ذلك ، فإن القاعدة العامة هي أن أي شيء يزيد عن 50 خطوة يقدم تحسينات متناقصة. حمّل أحد المستخدمين مقارنة مرئية لكيفية تأثير الخطوات والعينات على الصورة الناتجة .
- تثبيت الوجه: توفر بعض المواقع القدرة على "إصلاح" الوجوه باستخدام خوارزميات مثل GFPGAN ، والتي يمكن أن تجعل الصور الشخصية تبدو أكثر واقعية.
- ControlNet: خوارزمية جديدة ، وغير مستخدمة على نطاق واسع. تم تصميم ControlNet خصيصًا لتوليد صورة إلى صورة ، "تأمين" جوانب الصورة الأصلية بحيث لا يمكن تغييرها. إذا كانت لديك صورة قطة سوداء وتريد تغييرها إلى كاليكو ، فيمكن استخدام ControlNet للحفاظ على الوضع الأصلي ، ببساطة عن طريق تغيير اللون.
- التحسين: عادةً ما تكون الصور الافتراضية صغيرة ، مربعة ، 1024 × 1،024 صورة ، ولكن ليس دائمًا. على الرغم من أن الترقية غالبًا ما "تكلف" أكثر من حيث الوقت وموارد الحوسبة ، إلا أن ترقية الصورة هي إحدى الطرق للحصول على صورة "كبيرة" يمكنك استخدامها لأغراض أخرى إلى جانب التباهي أمام أصدقائك على وسائل التواصل الاجتماعي.
- الرسم الداخلي: هذا شكل مثير للاهتمام إلى حد ما لتحرير الصور. إن Inpainting هو في الأساس مثل Photoshop plus AI: يمكنك التقاط صورة وتمييز منطقة معينة ، ثم تغيير تلك المنطقة باستخدام AI. (يمكنك أيضًا تعديل كل شيء ما عدا المنطقة المميزة ، بدلاً من ذلك). تخيل تحميل صورة لوالدك ، "رسم" المنطقة التي يوجد بها شعره ، ثم إضافة تاج أو شعر مستعار للمهرج باستخدام الذكاء الاصطناعي.
- Outpainting: يستخدم هذا الذكاء الاصطناعي لتوسيع حدود المشهد. تخيل أن لديك صورة صغيرة تم التقاطها على أحد الشواطئ في إيطاليا. يمكنك استخدام الرسم الخارجي "لتوسيع" اللقطة ، وإضافة المزيد من الشاطئ (الذي تم إنشاؤه بواسطة الذكاء الاصطناعي) ، وربما بعض الطيور أو مبنى بعيد. إنه ليس شيئًا تفكر فيه عادةً!
يمكن أن يكون فن الذكاء الاصطناعي مخيفًا لجيل من الفنانين الذين قد يضطرون الآن ، ربما بشكل غير عادل ، إلى التنافس مع فن الذكاء الاصطناعي الذي يتم إنشاؤه آليًا. (تخيل كيف يكون الحال بالنسبة للكاتب عندما يختبر روبوتات الدردشة بالذكاء الاصطناعي مثل ChatGPT و Bing و Google Bard !)
ومع ذلك ، نختار أن ننظر إلى فن الذكاء الاصطناعي باعتباره منفذًا إبداعيًا فريدًا خاصًا به ، مما يشجعك على التفكير في القطع الخاصة بك وإنشاءها. بعد كل شيء ، يمكنك شراء الطعام من مطعم ، أو اتباع وصفة ودمج المكونات بنفسك. لكل منها مكانها. إن تشجيع المزيد من الأشخاص على أن يصبحوا جزءًا من العملية الإبداعية هو ما يدور حوله فن الذكاء الاصطناعي.