تقویت پروژه آکسفورد در شرکت مایکروسافت به کمک هوش مصنوعی

پروژه شرکت مایکروسافت با نام آکسفورد، مجموعه‌ای از ابزارهای توسعه در زمینه تحقیقات یادگیری ماشین و هوش مصنوعی این شرکت است. بنا بر گزارش این شرکت در کنفرانس لندن، اکنون پنج سرویس دیگر نیز در حال اضافه شدن به این پروژه است.
توسعه‌دهندگان اکنون می‌توانند از سرویس تشخیص احساسی استفاده کنند که به یک عکس نگاه می‌کند و فهرستی از احساساتی که بر روی صورت سوژه تشخیص داده‌است ارائه می‌کند.
برای هر شخص در تصویر(تا تعدادی مشخص)، این سرویس احتمال اینکه‌ فرد چقدر احساس عصبانی، خوشحال، ترسیده، متعجب، ناراحت، تحقیر، انزجار یا هیچ‌کدام را دارد به عنوان خروجی برمی‌گرداند.
به گفته رایان گلگان، یکی از مدیران ارشد مایکروسافت، این شرکت این سرویس را پس از آن ساخته است که در کاربردهایی که تحلیل احساس بر روی عکس‌ها انجام می‌شده، توسعه‌دهندگان از فناوری تشخیص صورت موجود در پروژه آکسفورد ، استفاده می‌کردند. سرویس جدید، کاربردهای متفاوتی را امکان‌پذیر می‌کند، از جمله ویرایش عکس‌ها بر اساس احساس افرادی که در عکس هستند.
البته هنوز نمی‌توان گفت توسعه‌دهندگان مایکروسافت توانسته‌اند محصولی که در ردیابی احساس متخصص است را ارائه کنند. این سرویس در حال حاضر فقط می‌تواند تصاویر ایستا را بررسی کند. هم‌چنین به گفته گلگان، شرکت مایکروسافت گفته ‌است درباره خروجی مدل‌های تشخیص احساس در برخی موارد اطمینان بیش‌تری دارد، مثلاً پیدا کردن خوشحالی به نسبت تشخیص تحقیر و یا انزجار برای آکسفورد ساده‌تر است.
در مورد ویدئو، تا پایان امسال، پروژه آکسفورد پشتیبانی بتایی از ابزارهای ویدئو شامل ردیابی حرکت و تثبیت تصویر ارائه خواهد کرد. این سرویس هم‌چنین ابزارهای ردیابی صورت خواهد داشت که گزارش می‌کند افراد در هر فریم از ویدئو کجا هستند، تا بدین ترتیب تحلیل رخداد موجود توسط کاربر امکان‌پذیر شود.
متناسب با حجم ویدئو، ممکن است پردازش یک پرونده با یکی از این سرویس‌ها زمانی را به طول انجامد. مایکروسافت محدودیتی برای اندازه پرونده‌هایی که به سرویس می‌توانید بدهید قرار داده ‌است، و گلگان می‌گوید توسعه‌دهندگان باید وضوح پرونده‌های بزرگ را کم کنند.
در زمینه صدا، مایکروسافت سرویس هوشمند بازشناسی سفارشی (CRIS) ، را ارائه کرده ‌است که به توسعه‌دهندگان امکان می‌دهد مدلی بازشناسی صدا را برای شرایط خاصی بسازند. به منظور دریافت نتایج بهتر، توسعه‌دهندگان می‌بایست به سرویس مجموعه‌ای از پرونده‌های صوتی را به همراه متن گفتار آن بدهند تا مدل گفتار ساخته شود.
ویژگی بازشناسی گوینده نیز در آینده‌ی نزدیک در ابزار بازشناسی گفتار پروژه آکسفورد قرار خواهد گرفت. در حال حاضر، این ابزار نمی‌تواند مثلاً با تحلیل یک مکالمه ضبط شده تشخیص دهد چه کسی و چه زمانی صحبت کرده‌است؛ اما این امکان را برای توسعه‌دهندگان فراهم می‌کند تا تکه کوتاهی از پرونده‌‌ای که فردی در آن صحبت می‌کند را به عنوان ورودی بگیرد و مشخص کند آیا این فرد همان کسی است که سامانه برای بازشناسی وی تحت آموزش قرار گرفته است با خیر.
به عقیده گلگان این سامانه هنوز به اندازه کلمه عبور یا اثر انگشت امن نیست، اما می‌تواند به عنوان نشانه‌ای از این‌که آیا این فرد همان کسی‌است که ادعا می‌کند، به کار رود.
بازشناسی گوینده و تشخیص صورت در کنار یکدیگر می‌توانند به عنوان پایه یک سامانه‌ی امنیتی، مشابه با پروژه آباکوس گوگل، به کار روند. این سامانه می‌تواند تصدیق هویت یک کاربر را بر اساس انواعی از نشانه‌ها شامل صدا، و بازشناسی صورت انجام دهد. آباکوس هنوز در مرحله ساخت است.
همه این سرویس‌ها در محیط ابر مایکروسافت انجام خواهند شد، بدان معنا که برنامه‌ها برای استفاده از واسط‌های برنامه‌سازی پروژه آکسفود باید به اینترنت متصل شوند. گلگان می‌گوید برخی از توسعه‌دهندگان درخواست استفاده از قابلیت‌های پروژه آکسفورد را به صورت برون‌خط (آفلاین) داده‌اند، اما مایکروسافت فعلاً می‌خواهد آن‌ها به صورت برخط (آنلاین) بمانند.

منبع: asis