نشر على ٢٥-٠٩-٢٠١٩

الرقص س آلة التعلم: الخطوات الأولى

إنشاء مجموعات بيانات جديدة واستكشاف خوارزميات جديدة في سياق أداء الرقص "شخصيات منفصلة"

في فبراير 2018 ، كتب لي دايتو مانابي رسالة إلكترونية تحتوي على موضوع "Dance x Math (ML)" ، يسألني عما إذا كنت مهتمًا بالعمل في مشروع جديد. لديّ خلفية عمل في سياق الرقص في الماضي ، بما في ذلك المسح الضوئي ثلاثي الأبعاد مع ليزا بارا في عام 2010 ، ومفاعل التفاعل في الحركة مع YCAM في عام 2013 ، وعبر الجمجمة عبر Daito و Klaus Obermaier في 2014-2015.

كنت متحمسًا جدًا لإمكانية العمل مع Mikiko و Elevenplay ، ومرة ​​أخرى مع Daito. شارك Daito و Mikiko بعض الأفكار الأولية والإلهام لهذه القطعة ، وخاصة الأفكار الناشئة عن تطور الرياضيات. بدايةً من الطريقة التي تم بها استخدام الأجسام في العد منذ عصور ما قبل التاريخ ، وصولاً إلى انطباعات آلان تورينج عن أجهزة الكمبيوتر امتدادًا للحم البشري ، إلى محاولات حديثة لتصنيف الجسم وقياسه باستخدام خوارزميات في سياق المراقبة ورؤية الكمبيوتر.

نظام عد الجسم من شعب أوكسابمين في بابوا غينيا الجديدة. [وصف الصورة: رسم من الجزء العلوي من الجسم مع أرقام تشير إلى 27 نقطة ، بما في ذلك الأصابع والمعصم والذراع والكوع والكتف والرقبة والأذن والعينين والأنف ، وما إلى ذلك]

بعد محادثات طويلة حول هذه المواضيع ، اخترنا اسم الشخصيات المنفصلة للعب على التفسيرات المتعددة للكلمتين. ركزت على مشاهدتين متتاليتين قرب نهاية الأداء ، والتي أطلقنا عليها بشكل غير رسمي مشهد "تصحيح" ومشهد "AI dancer". كان الهدف من هذين المشهدين هو استكشاف إمكانيات تدريب نظام التعلم الآلي على توليد رقصات بأسلوب مشابه لارتجال إلفينبلاي. بالنسبة إلى الأداء في طوكيو ، أضفنا أيضًا عنصرًا جديدًا إلى مشهد التصحيح الذي يتضمن تسلسلات رقص تم إنشاؤها بناءً على مقاطع الفيديو التي تم التقاطها من الجمهور قبل الأداء. في هذا الكتابة ، سأقدم عملية تقييم للعمليات التي بدأت في إنشاء هذه المشاهد.

خلفية

هناك تاريخ طويل من الأنظمة التفاعلية والجيلية في سياق الرقص. بعض الأمثلة المبكرة التي أعلمها تأتي من سلسلة "9 أمسيات" في عام 1966. على سبيل المثال ، إيفون راينر مع "Carriage Discreteness" ، حيث تفاعل الراقصون مع تصميم الإضاءة والإسقاط وحتى العناصر الميكانيكية الآلية.

مقتطف من

في الآونة الأخيرة ، يوجد فنانين مهندسين قاموا ببناء مجموعات أدوات أو مجتمعات حول الرقص. على سبيل المثال ، طور مارك كونيجليو إيسادورا بدءًا من الأدوات التي أنشأها في عام 1989.

لقطة من إيزادورا لمارك كونيليو. [وصف الصورة: لقطة شاشة لبيئة الترقيع مع أسلاك مستقيمة تربط عشرات العقد بأحجام مختلفة مع أيقونات لإدخال الميكروفون وجداول الموجات وأصول الفيديو ومدخلات الكاميرا وغيرها من الميزات.]

أو Kalypso و EyeCon by Frieder Weisse ، ابتداءً من حوالي عام 1993.

لقطة للشاشة من إيكون لفريدر فايس. [وصف الصورة: لقطة شاشة للبرنامج الذي يعمل على نظام التشغيل Windows 2000 مع لوحات متعددة لإدخال الكاميرا الحية مع بعض تراكبات التصحيح ونص التصحيح والمعلمات. كل لوحة عبارة عن نافذة داخل نافذة التطبيق الكبيرة بعنوان

لقد كنت شخصياً مستوحاة للغاية من OpenEnded Group ، التي كانت تعمل على طرق رائدة لتصور وزيادة الراقصين منذ أواخر التسعينيات.

تم تطوير العديد من القطع من قبل OpenEnded Group في بيئتها المخصصة المسماة "Field" ، والتي تجمع بين عناصر الترقيع القائم على العقدة ، والبرمجة القائمة على النصوص ، والتحرير الرسومي.

الحقل بواسطة مجموعة OpenEnded. [وصف الصورة: لقطة شاشة للعديد من النوافذ التي تعمل داخل الإصدار الأول من نظام التشغيل Mac OS X بما في ذلك نافذة مع رمز Python ، ونافذة عرض / تقديم ، وجدول زمني بياني للأحداث ، وأيقونات لتشغيل البرنامج وتصحيحه.]

AI راقصة المشهد

بالنسبة لعملي على الشخصيات المنفصلة ، استلهمت من عدد قليل من المشاريع البحثية الحديثة التي تطبق تقنيات من التعلم العميق إلى حركة الإنسان. أكبر إلهام يسمى "chor-rnn" من قبل لوكا ولويز كرنكوفيتش-فريس.

في chor-rnn ، يقومون أولاً بجمع خمس ساعات من البيانات من راقص واحد معاصر باستخدام Kinect v2 لالتقاط الحركة. ثم يقومون بمعالجة البيانات باستخدام بنية شبكة عصبية شائعة تسمى LSTM. هذا هو بنية الشبكة العصبية المتكررة (RNN) مما يعني أنه مصمم لمعالجة البيانات المتسلسلة ، على عكس البيانات الساكنة مثل الصورة. يعالج RNN إطار التقاط الحركة لإطار واحد في كل مرة ، ويمكن تطبيقه على مشاكل مثل تصنيف أسلوب الرقص أو جيل الرقص. "chor-rnn" هي لعبة الكلمات "char-rnn" ، وهي بنية شائعة تستخدم لتحليل وتوليد نص حرف واحد في وقت واحد.

بالنسبة للأشكال المنفصلة ، جمعنا حوالي 2.5 ساعة من البيانات باستخدام نظام التقاط الحركة Vicon بسرعة 60 إطارًا في الثانية في 40 جلسة تسجيل منفصلة. تتكون كل جلسة من واحدة من ثمانية راقصات يرتدين بأسلوب مختلف: "روبوت" ، "حزين" ، "لطيف" ، وما إلى ذلك. حصل الراقصون على 120 دقيقة في الدقيقة للحفاظ على توقيت ثابت.

مثال على جلسة التقاط الحركة: بيانات الدوران على شكل أرباع ، مرسومة بمرور الوقت. [وصف الصورة: العشرات من قطع الخطوط المكدسة كصفوف ، علق المحور ص

هذه البيانات مختلفة تمامًا عن معظم مجموعات بيانات التقاط الحركة الموجودة ، والتي يتم تصميمها عادةً لصنع ألعاب الفيديو والرسوم المتحركة. يتم أيضًا تصميم أبحاث أخرى حول حركة الإنسان التوليفية لتحقيق هذه الغاية ، على سبيل المثال ، "الشبكات العصبية التي تعمل طورًا للتحكم في الأحرف" من جامعة إدنبرة تأخذ من عصا التحكم ، والتضاريس ثلاثية الأبعاد ، ومرحلة دورة المشي ، وحركة الشخصيات المخرجة.

نحن مهتمون أكثر بأشياء مثل الاختلافات بين الراقصات والأساليب ، وكيف يرتبط إيقاع الموسيقى بالرقص المرتجل. من أجل استكشافنا الأول في هذا الاتجاه ، عملنا مع Parag Mital لصياغة وتدريب شبكة تسمى dance2dance. تعتمد هذه الشبكة على بنية seq2seq من Google ، والتي تشبه char-rnn حيث إنها بنية شبكة عصبية يمكن استخدامها للنمذجة المتسلسلة.

عادة ، يتم استخدام seq2seq لنمذجة وتوليد اللغة. قمنا بتعديله للتعامل مع بيانات التقاط الحركة. بناءً على نتائج chor-rnn ، استخدمنا أيضًا تقنية تسمى "شبكات كثافة الخليط" (MDN). تتيح لنا MDN التنبؤ بتوزيع الاحتمالات عبر نتائج متعددة في كل خطوة زمنية. عند التنبؤ ببيانات منفصلة مثل الكلمات أو الأحرف أو الفئات ، من المعتاد التنبؤ بتوزيع الاحتمالات عبر الاحتمالات. ولكن عند توقع قيمة مستمرة ، مثل التدوير أو المراكز ، يكون الافتراضي هو التنبؤ بقيمة واحدة. يمنحنا MDN القدرة على التنبؤ بقيم متعددة واحتمال كل منها ، مما يسمح للشبكة العصبية بتعلم بنية أكثر تعقيدًا للبيانات. بدون الشبكات متعددة الاستخدامات (MDN) فإن الشبكة العصبية إما تقوم بنسخ ونسخ بيانات التدريب ، أو تولد مخرجات "متوسطة".

أحد الأسئلة الفنية الكبيرة التي كان علينا معالجتها أثناء العمل على ذلك هو كيفية تمثيل الرقص. بشكل افتراضي ، يتم تخزين البيانات من نظام التقاط الحركة بتنسيق يسمى BVH ، والذي يوفر بنية هيكلية مع أطراف ذات طول ثابت ومجموعة من المواضع وإزاحة الدوران لكل إطار. يتم تشفير البيانات في الغالب باستخدام التدوير ، باستثناء موضع الورك ، والذي يستخدم لتمثيل الموقع الكلي للراقصة في العالم. إذا كنا قادرين على توليد بيانات التناوب مع الشبكة العصبية ، فيمكننا إنشاء ملفات BVH جديدة واستخدامها لتحويل نموذج ثلاثي الأبعاد مزور من راقصة افتراضية.

مثال ملف BVH بهيكل هيكلي على اليسار وإطارات البيانات على اليمين. انظر هنا للحصول على مثال ملف BVH. [وصف الصورة: لقطة شاشة لمحرر النص مع عمودين يعرضان بيانات متداخلة على الجانب الأيسر مكتوب عليها

يستخدم chor-rnn بيانات الموضع ثلاثي الأبعاد ، مما يعني أنه من المستحيل التمييز بين شيء مثل اليد الممدودة التي تواجه كف اليد مقابل كف اليد ، أو ما إذا كان رأس الراقصة يواجه اليسار مقابل اليمين.

هناك بعض القرارات الأخرى التي يجب اتخاذها حول كيفية تمثيل حركة الإنسان.

  • البيانات: الموقف أو التناوب.
  • التمثيل: للموقف ، هناك إحداثيات الديكارتية والكروية. للدوران ، توجد مصفوفات دوران ، ورباعيات ، وزوايا Euler ، وزاوية محور.
  • العلاقة الزمنية: البيانات المطلقة مؤقتًا ، أو الاختلاف بالنسبة للإطار السابق.
  • العلاقة المكانية: البيانات المطلقة المكانية ، أو الاختلاف بالنسبة للمفصل الأصل.

كل من هذه لها فوائد وعيوب مختلفة. على سبيل المثال ، باستخدام "مراكز" البيانات النسبية مؤقتًا ، فإن البيانات تسهل نمذجة (يستخدم هذا النهج David Ha من أجل رسم-رن) ، ولكن عند إنشاء الموضع المطلق يمكن أن ينجرف ببطء.

يمكن أن يساعد استخدام زوايا Euler في تقليل مقدار المتغيرات إلى النموذج ، ولكن الزوايا تلتف بطريقة يصعب نمذجةها باستخدام الشبكات العصبية. تواجه مشكلة مماثلة عند استخدام الشبكات العصبية لنمذجة مرحلة الإشارات الصوتية.

في حالتنا ، قررنا استخدام المربعات الزمنية والمكانية المطلقة. في البداية ، واجهنا بعض المشكلات في التقليب الملفوف والرباعي ، لأن الربعين لهما تمثيلان متكافئان لأي اتجاه ، لكن من الممكن قصر الاقتباسات على تمثيل واحد.

قبل تدريب شبكة dance2dance ، جربت بعض التجارب الأخرى على البيانات. على سبيل المثال ، قم بتدريب جهاز تشفير تلقائي (VAE) على "ضغط" كل إطار من البيانات.

من الناحية النظرية ، إذا كان من الممكن ضغط كل إطار ، فمن الممكن أن تنشئ في تلك المساحة المضغوطة بدلاً من القلق بشأن نمذجة المساحة الأصلية. عندما حاولت إنشاء باستخدام LSTM 3 طبقات المدربين على البيانات التي تمت معالجتها VAE ، كانت النتائج "هشة" بشكل لا يصدق. (أفترض أن السبب في ذلك هو أنني لم أدمج أي شرط من السلاسة الزمنية ، وتعلم VAE مساحة كامنة تدريجيًا جدًا قادرة على إعادة بناء الإطارات الفردية بدلاً من تعلم كيفية الاستيفاء الصريح.)

بعد تدريب شبكة dance2dance لبضعة أيام ، بدأنا في الحصول على مخرجات تشبه بعض بيانات المدخلات الخاصة بنا. الفرق الأكبر في جميع هذه التجارب هو أن الوركين مثبتة في مكانها ، مما يجعلها تبدو وكأنها راقصة تم توليدها حول مقعد دراجة. تم إصلاح الوركين لأننا كنا نمثِّل التدويرات فقط ولم نقم بوضع نموذج لتعويض موضع الورك.

مع اقتراب الموعد النهائي للأداء ، قررنا إيقاف التدريب والعمل مع النموذج الذي لدينا. كانت الشبكة تولد نوعًا من الحركة غير الإنسانية التي كانت لا تزال تذكر إلى حد ما بالحركة الأصلية ، وشعرت بأنها مناسبة للشعور الذي كنا نحاول خلقه في الأداء.

أثناء العرض ، تبدأ الراقصة الحقيقية من Elevenplay MAR 未 那 子 (MARUYAMA Masako ، أو Maru) المشهد من خلال استكشاف الفضاء حول الراقصة AI ، والحفاظ على مسافة لها بمزيج من الفضول والشك. في النهاية ، يحاول مارو تقليد الراقصة. بالنسبة لي ، هذه واحدة من أكثر اللحظات إثارة لأنها تمثل تحولًا في حركة الإنسان التي مرت عبر شبكة عصبية تجسدها راقصة مرة أخرى. يتم بعد ذلك إقحام الحركة المولدة مع تصميم الرقصات لإنتاج دويتو يتطور ببطء بين مارو وراقصة الذكاء الاصطناعى. أثناء هذه العملية ، "يأتي النموذج ثلاثي الأبعاد المجهز" إلى حيز الحياة "ويتغير من النقطة ثلاثية الأبعاد الفضية إلى راقصة محببة. بالنسبة لي ، هذا يمثل الطريقة التي تظهر بها الحياة عندما يتم مشاركة التعبير الإبداعي بين الناس ؛ الطريقة التي يمكن أن تكمل بها المشاركة شيئًا غير مكتمل. عندما ينتهي المشهد ، تحاول راقصات الذكاء الاصطناعي الخروج من المسرح ، لكن مارو احتياطي في نفس الاتجاه مع امتد النخيل نحو راقصة الذكاء الاصطناعي. تتحول راقصة الذكاء الاصطناعى مرة أخرى إلى النقطة الفضية وتترك تتلوى وحدها في حالتها غير المكتملة ، دون وجود جسم حقيقي أو أي روح إنسانية لاستكماله.

تصحيح المشهد

يسبق المشهد debug مشهد الراقصة AI ويعمل كمقدمة مجردة. بالنسبة لمشهد تصحيح الأخطاء ، قمت بتجميع مجموعة متنوعة من البيانات المختلفة من عملية التدريب والتوليد وتقديمها كنوع من المناظر الطبيعية للاستكشاف.

هناك أربعة عناصر رئيسية لمشهد تصحيح الأخطاء ، تليها مجموعة من البيانات التي تم التقاطها من الجمهور قبل الأداء.

يوجد في الوسط راقصة تم إنشاؤها ، بما في ذلك الهيكل العظمي والنموذج ثلاثي الأبعاد المجهز. تغطي الراقصة المولدة مجموعة من المكعبات الدوارة ، والتي تمثل دورات لكل من المفاصل في النموذج. على اليمين واليسار توجد سحب ثلاثية الأبعاد تعتمد على البيانات التي تم إنشاؤها.

[وصف الصورة: لا يزال من مشهد التصحيح الذي يظهر سحابة النقطة مع الكثير من المحلاقات الطويلة من الألوان المتشابهة التي تخرج في كل اتجاه ، وتخرج من بعضها إلى بعض وتنتهي مرة أخرى باتجاه مركز المساحة.]

كل نقطة في الغيوم نقطة يتوافق مع إطار واحد من البيانات التي تم إنشاؤها. تمثل سحابة النقطة الواحدة بيانات الدوران الخام ، وتمثل سحابة النقطة الأخرى حالة الشبكة العصبية في تلك الفترة الزمنية. يتم إنشاء السحب نقطة باستخدام تقنية تسمى UMAP بواسطة Leland McInnes.

مثال سحابة نقطة UMAP الناتجة عن مجموعة بيانات Fashion MNIST. [وصف الصورة: نقطة سحابة تظهر مجموعات مفصولة مكانيًا ولونًا ، مع وجود مفتاح للألوان مكتوب عليها

من السهل رسم نقاط ثلاثية الأبعاد أو ثلاثية الأبعاد ، ولكن عندما يكون لديك أكثر من 3 أبعاد ، قد يكون من الصعب تصورها. يساعد UMAP في هذه المشكلة عن طريق أخذ عدد كبير من الأبعاد (مثل جميع قيم التناوب للإطار الفردي لبيانات الرقص) وإنشاء مجموعة من النقاط ثلاثية الأبعاد لها بنية مماثلة. هذا يعني أن النقاط القريبة في الفضاء ذي الأبعاد العالية يجب أن تكون قريبة في الفضاء ثلاثي الأبعاد ثلاثي الأبعاد. خوارزمية شعبية أخرى لهذا هي t-SNE.

العنصر الأخير هو المكعب الدوراني الكبير في الخلفية المصنوع من مربعات سوداء وبيضاء.

[وصف الصورة: عرض درامي بزاوية واسعة مكونة من أرقام صغيرة ومستطيلات بالأبيض والأسود بأحجام مختلفة ، يحيط المكعب بمشهد تصحيح الأخطاء بالكامل ، ويصبح صغيرًا جدًا في وسط المساحة.]

هذا إشارة إلى تقنية تقليدية لتصور حالة الشبكات العصبية ، تسمى مخطط هينتون.

مقتطفات من ورقة 1991 من قبل هينتون وآخرون. [وصف الصورة: خمسة صفوف منفصلة من الخطوط الأفقية بالأبيض والأسود الكثيفة مع مستطيلات بالأبيض والأسود تغطي أجزاء من الخطوط الأفقية.]

في هذه المخططات ، تمثل المربعات السوداء أرقام سالبة والمربعات البيضاء تمثل أرقام موجبة ، والحجم يناظر القيمة. تاريخيا ، كانت هذه المخططات مفيدة لفحص ومقارنة الحالة الداخلية للشبكة العصبية باليد بشكل سريع. في هذه الحالة ، نقوم بتصور حالة شبكة dance2dance التي تولد الحركة.

يعتمد تسلسل نهاية مشهد التصحيح على البيانات التي تم جمعها قبل كل أداء. يُطلب من الجمهور الرقص لمدة دقيقة أمام خلفية سوداء ، وشخص واحد في المرة الواحدة. نعرض مثالاً للرقص من أجل الإلهام ونعرض في الوقت الفعلي نتائج تعقب لمساعدة الجمهور على فهم ما يتم جمعه. تم بناء كشك الالتقاط هذا بواسطة 浅井 裕 太 (ASAI Yuta) و 毛利恭 平 (MŌRI Kyōhei) ويتميز الرقص المثال بنموذج مزخرف من Maru تم تقديمه بواسطة Rhizomatiks.

[وصف الصورة: ردهة مكان الأداء مع جهاز عرض على اليمين وصبي صغير على اليسار. يقف الطفل على سجادة سوداء ذات خلفية سوداء تضيءها الأنوار ، وينظر إلى الشاشة ويفسر راقصة على الشاشة. يشاهد الأطفال والعائلة الآخرون الشاشة من الجانب.]

مع كل عضو جمهور ، نقوم بتحميل فيديو رقصهم على جهاز بعيد يحلل حركتهم باستخدام OpenPose. في أيام الأداء ، احتفظنا بـ 16 p2.xlarge من مثيلات AWS جاهزة وجاهزة لاستيعاب هذه البيانات ، والتي تتم تلقائيًا بواسطة 2bit.

[وصف الفيديو: مقطع فيديو به غطاء عظمي متراكب على شكل عجينة لاثنين من الباحثين يرتديان بنطال الجينز المطابق والقمصان المبطنة ، ويظهران أمام قبة سداسية كبيرة بها العديد من الأسلاك داخل منشأة الأبحاث ، ويمسكون بأيديهم ويحملون الملحقات لإظهار دقة تتبع.]

بعد تحليل حركتهم ، نقوم بتدريب بنية تسمى pix2pixHD لإنشاء صور من الأشكال المقابلة. على الرغم من توفر pix2pixHD عادةً بموجب ترخيص غير تجاري ، فقد منحتنا NVIDIA استثناءًا لهذا الأداء.

[وصف الفيديو: خريطة دلالة ملونة لمشهد من داخل سيارة تبحث عن مسحات تتلاشى للكشف عن صورة واقعية غير طبيعية تم إنشاؤها من الخريطة الدلالية.]

بمجرد تدريب pix2pixHD ، يمكننا تجميع مقاطع فيديو رقص "مزيفة" تعرض نفس الشخص. هذه العملية مستوحاة بشكل كبير من "الجميع يرقصون الآن" بقلم كارولين تشان وآخرون.

في حالتنا ، نقوم بتركيب الرقص أثناء عملية التدريب. هذا يعني أن الصور الأولى في التسلسل تبدو ضبابية وغير واضحة ، ولكن بحلول نهاية المشهد ، تبدأ في حل ميزات أكثر قابلية للتعريف. خلال النصف الأول من هذا القسم ، نعرض تراكبًا متقطعًا لشبكة الراقصات التي تم إنشاؤها ، وخلال النصف الثاني نعرض تراكبات قصيرة للإطار الأفضل مطابقة من تسجيل الفيديو الأصلي. وقد وضعت رمز مطابقة بقلم أساي.

بينما يتم تشغيل معظم الشخصيات المنفصلة في الوقت الفعلي ، يتم تقديم مشهد تصحيح الأخطاء مسبقًا في إطار عمل مفتوح ويتم تصديره كملف فيديو لتقليل احتمالات حدوث خطأ ما في منتصف العرض. نظرًا لأن الفيديو يتم إعادة تقديمه لكل عرض ، فقد تطلب الأمر إدارة نوع فريد من الوقت:

  • تفتح أبواب المعرض ساعة واحدة قبل كل أداء.
  • يسجل كل عضو جمهور لمدة دقيقة واحدة مع بعض الوقت قبل وبعد الصعود والمشي بعيدا.
  • نقوم بالتدريب وتقديم باستخدام pix2pixHD لمدة 15 دقيقة للشخص الواحد (بما في ذلك إنشاء الفيديو ونقل الملفات من AWS إلى المكان).
  • يستغرق عرض الفيديو من مقاطع الفيديو التي تم إنشاؤها 12 دقيقة.
  • يجب علينا تسليم الفيديو للفحوصات النهائية قبل 15 دقيقة من تعتيم الأضواء (حيث يجلس الجمهور).

سمح لنا هذا بتضمين ما يصل إلى 15 عضوًا من الحضور في كل أداء.

صور تم إنشاؤها بناءً على فيديو للجمهور باستخدام pix2pixHD. [وصف الصورة: شبكة من الصور ذات الأشكال الباهتة التي تشبه الإنسان على خلفية سوداء مع بعض الأرجل الواضحة والسترات والأذرع والرؤوس والكثير من ضوضاء الأنماط الثابتة المشبعة في مناطق السطوع المتوسط.]أفضل الصور مطابقة من فيديو للجمهور. [وصف الصورة: شبكة من صور لأعضاء الجمهور يرقصون على خلفية سوداء ، وكل أذرعهم ممدودة إلى اليسار.]

على الرغم من أن مارو لديها فرصة لتجربة عملية إعادة تصور بيانات حركتها بواسطة الآلة ، فإن هذا القسم الأخير من مشهد التصحيح يمنح الجمهور فرصة أن يكون لديهم نفس الشعور. يتبع سمة متكررة خلال الأداء بأكمله: رؤية إنسانيتك تنعكس في الجهاز ، والعكس صحيح.

مستقبل

بعد ذلك ، سنستكشف تمثيلات البيانات الأخرى ، ومعماريات الشبكات الأخرى ، وإمكانية توليد الشرطية (توليد رقصات بأسلوب معين أو من راقصة معينة ، أو إلى إيقاع محدد) والتصنيف (تحديد كل من هذه السمات من بيانات الإدخال ، على سبيل المثال اتبع إيقاع راقصة مع الموسيقى تولد). في حين أن عملية التدريب لهذه البنى يمكن أن تستغرق وقتًا طويلاً ، بمجرد أن يتم تدريبهم ، يمكن أن يحدث التقييم في الوقت الفعلي ، مما يتيح إمكانية استخدامها في سياقات تفاعلية.

قروض

الأشكال المنفصلة هي ساعة تقريبًا ، وتصف هذه المقالة جزءًا صغيرًا فقط من الأداء. الاعتمادات للقطعة بأكملها أدناه ، وتتوفر أيضًا على موقع المشروع.

ممثلون مشاركون KOHMEN (ELEVENPLAY) / ERISA (ELEVENPLAY) / سايا (ELEVENPLAY) / KAORI (ELEVENPLAY) / مارو (ELEVENPLAY) / EMMY (ELEVENPLAY) / YU (ELEVENPLAY)
اتجاه المرحلة | الكوريغرافيا ميكو
الاتجاه الفني | موسيقى ديتو مانابي (أبحاث ريزوماتكس)
التوجيه الفني | هندسة الأجهزة Motoi Ishibashi (Rhizomatiks Research)
آلة التعلم الاتجاه كايل ماكدونالد
التعلم الآلي يوتا أساي (أبحاث ريزوماتكس)
شبكة البرمجة 2bit
نظام الإسقاط | هندسة البرمجيات يويا هاناي (أبحاث ريزوماتكس)
التصور ساتوشي هوري (أبحاث ريزوماتيك) / أنت تاناكا (أبحاث ريزوماتيك) / فوتا كيرا (أبحاث ريزوماتكس)
CG Direction Tetsuka Niiyama (+ Ring / TaiyoKikaku Co.، Ltd.)
CG Producer Toshihiko Sakata (+ Ring / TaiyoKikaku Co.، Ltd.)
موسيقى Daito Manabe / Hopebox / Kotringo / Krakaur / Setsuya Kurotaki / Seiho
مصور فيديو Muryo Homma (أبحاث ريزوماتيك)
المرحلة الهندسية موموكو نيشيموتو (أبحاث ريزوماتيك)
موشن كابتشر تاتسويا إيشي (أبحاث ريزوماتيك) / ساكي إيشيكاوا (أبحاث ريزوماتيك)
4D-VIEWS Crescent، inc.
الدعم الفني شينتارو كاميجو (أبحاث ريزوماتيك)
Craft Tomoaki Yanagisawa (أبحاث ريزوماتيك) / توشيتاكا موتشيزوكي (أبحاث ريزوماتكس) / كيوهي موري (أبحاث ريزوماتيك)
المصمم الترويجية هيرويسو كيمورا (تصميم ريزوماتيك) / هيروفومي تسوكاموتو (تصميم ريزوماتيك) / كاوري فوجي (تصميم ريزوماتيك)
إدارة الإنتاج Yoko Shiraiwa (ELEVENPLAY) / Nozomi Yamaguchi (Rhizomatiks Research) / Ayumi Ota (Rhizomatiks Research) / Rina Watanabe (Rhizomatiks Research)
منتج Takao Inoue (أبحاث ريزوماتيك)
إنتاج Rhizomatiks المشترك ، المحدودة.

أنظر أيضا

الفن والمقتنيات تسعير الشفافية للأسواق العالمية ؛ شركاء الدستور الغذائي مع Artvalأقل ، ولكن أفضل: الفضاء السلبي في أي بلد لكبار السن من الرجالفوائد الغيب للتصوير الفوتوغرافي في الشوارع مع الأصدقاءالحصان هو جيد مثل الغمز إلى إيماءة أعمىلم يفلت بانكسي لوحته. فعل سوق الفن.التقليد سوف تجعلك أكثر الأصلي