گسترش هوش مصنوعی روی دستگاه در Microsoft Edge: مدل‌ها و APIهای جدید برای وب


در بیلد 2025، APIهای Prompt and Writing Assistance را در Microsoft Edge با مدل زبان Phi-4-mini معرفی کردیم. از آن زمان، ما از توسعه‌دهندگان وب شنیده‌ایم، بازخورد شما را لحاظ کرده‌ایم و قابلیت‌های هوش مصنوعی Edge را با مدل‌ها و APIهای جدید گسترش داده‌ایم.

امروز سه به‌روزرسانی را معرفی می‌کنیم:

  1. پیش‌نمایش برنامه‌نویس از پیش‌نشر Aion-1.0-Instruct مدل زبان کوچک برای تست اولیه و بازخورد.
  2. این آشکارساز زبان و API های مترجم در Edge 148، که توسط مدل‌های روی دستگاه، مخصوص کار، پشتیبانی می‌شود.
  3. تجربی تشخیص گفتار روی دستگاه با Web Speech API که در کانال‌های Edge Canary و Dev موجود است.

پیش نمایش برنامه نویس Aion-1.0-Instruct

در سال گذشته، APIهای Prompt and Writing Assistance از Phi-4-mini استفاده کرده اند. بسیار توانمند مدل زبان با پارامتر 4B، در Edge. در حالی که درک متن قوی، استدلال و پیروی از دستورالعمل ها را برای سناریوهای وب ارائه می دهد، مدل الزامات سخت افزاری در دسترس بودن آن را در بین دستگاه ها محدود کرده اند.

امروز، ما یک پیش‌نمایش توسعه‌دهنده از پیش‌نشر را معرفی می‌کنیم Aion-1.0-Instruct مدل زبان کوچک در کانال های Edge Canary و Dev. این مدل زبان کوچکتر، سریعتر و کارآمدتر است. این پشتیبانی را به دستگاه‌های بیشتری گسترش می‌دهد – از جمله دستگاه‌هایی که پردازنده‌های گرافیکی کمتری دارند و از طریق استنتاج CPU، دستگاه‌های بدون GPU – در حالی که کیفیت بالایی را برای طیف گسترده‌ای از موارد استفاده وب ارائه می‌کند.

این پیش‌نمایش به شما امکان می‌دهد تا Aion-1.0-Instruct را در سناریوهای وب دنیای واقعی ارزیابی کنید، قابلیت همکاری API را آزمایش کنید، و بازخوردی ارائه دهید که بهینه‌سازی‌های نهایی را پیش از انتشار برنامه‌ریزی شده منبع باز برنامه‌ریزی شده آن در Hugging Face در ماه جولای راهنمایی می‌کند. برای امتحان کردن مدل، اسناد مربوط به آن را بررسی کنید Prompt API و APIهای کمک نوشتن، آزمایش با نمونه های زمین بازی، و نظرات خود را در مورد آن به اشتراک بگذارید GitHub.

API های آشکارساز زبان و مترجم در Edge 148

این آشکارساز زبان و مترجم APIها وب‌سایت‌ها و افزونه‌های مرورگر را قادر می‌سازند تا زبان متن را شناسایی کرده و بین جفت‌های زبان ترجمه کنند. این APIها اکنون در Edge 148 در دسترس هستند که توسط مدل‌های روی دستگاه و مخصوص کار که مستقیماً در مرورگر ساخته شده‌اند، پشتیبانی می‌شوند. آنها ترجمه سریع و با کیفیت را ارائه می دهند، از بیش از 145 زبان پشتیبانی می کنند و برای حجم کار ترجمه در وب بهینه شده اند.

شما می توانید از این API ها از جاوا اسکریپت در سایت یا برنامه افزودنی خود استفاده کنید و در مقایسه با سرویس های مبتنی بر ابر، حریم خصوصی کاربر، استقلال شبکه و هزینه ترجمه صفر را به دست آورید.

در ساده ترین شکل، زبان شناساگر و API های مترجم را می توان به صورت زیر استفاده کرد:

// Create a Language Detector session.
const detector = await LanguageDetector.create();

// Detect the language of the text.
const results = await detector.detect(userText);

// Use the results.
for (const result of results) {
  // Show the full list of potential languages with their likelihood,
  // ranked from most likely to least likely.
  console.log(result.detectedLanguage, result.confidence);
}

// Create a Translator session.
const translator = await Translator.create({
  sourceLanguage: "es",
  targetLanguage: "en"
});

// Translate the text and wait for the translation to be done.
const translatedText = await translatorSession.translate(userText);

// Use the translation. 
console.log(translatedText);

برای کسب اطلاعات بیشتر، اسناد مربوط به آن را بررسی کنید API آشکارساز زبان و API مترجم، ما را امتحان کنید نمونه های زمین بازی، و بازخورد خود را در آشکارساز زبان و مترجم مشکلات بازخورد در GitHub.

تشخیص گفتار روی دستگاه با Web Speech API

این Web Speech API به شما امکان می دهد ورودی صوتی یا صوتی را در وب سایت ها و برنامه های افزودنی مرورگر اضافه کنید. این API معمولاً توسط سرویس‌های مبتنی بر ابر برای تشخیص گفتار (گفتار به متن) و ترکیب (متن به گفتار) پشتیبانی می‌شود.

در جدیدترین کانال‌های Edge Canary و Dev، ما یک مدل مخصوص کار را معرفی می‌کنیم که گفتار را به صورت محلی در دستگاه کاربر پردازش می‌کند. این پیاده‌سازی بر روی دستگاه، حریم خصوصی کاربر را بهبود می‌بخشد، تأخیر را کاهش می‌دهد و سناریوهایی با اتصال کم که نیاز به استقلال شبکه دارند را باز می‌کند.

استفاده از قابلیت جدید تشخیص گفتار روی دستگاه فقط به به‌روزرسانی‌های جزئی کد Web Speech API موجود شما نیاز دارد، همانطور که نشان داده شده است:

// Create a SpeechRecognition instance.
const recognition = new SpeechRecognition();
recognition.lang = 'en-US';

// Use on-device speech recognition.
recognition.processLocally = true;

// Start speech recognition.
recognition.start();

برای شروع کار با تشخیص گفتار روی دستگاه، این را بررسی کنید مستندات، امتحان کنید دمو زمین بازی، و نظرات خود را در مورد آن به اشتراک بگذارید GitHub.

آن را امتحان کنید و به ما اطلاع دهید

با مدل زبان کوچک Aion-1.0-Instruct، API های جدید تشخیص دهنده و مترجم زبان، و تشخیص گفتار روی دستگاه در مایکروسافت اج، می توانید بدون تکیه بر سخت افزار تخصصی، خدمات ابری یا تخصص خاص دامنه، تجربه های وب مبتنی بر هوش مصنوعی را با استفاده از مدل های ساخته شده در مرورگر ایجاد کنید.

ما از شما دعوت می کنیم که این قابلیت ها را کشف کنید، مدل های جدید را آزمایش کنید و به ما بگویید چه چیزی می سازید. بازخورد شما تکرار بعدی هوش مصنوعی روی دستگاه در مایکروسافت اج را شکل خواهد داد، و ما هیجان زده هستیم که با شما همکاری کنیم، زیرا همچنان به گسترش آنچه برای هوش مصنوعی در وب امکان پذیر است ادامه می دهیم.



سایت محتوا مارکتینگ

برای دیدن مطالب آموزشی بیشتر در زمینه سخت افزار و نرم افزار اینجا کلیک کنید!

By psychen

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *