در بیلد 2025، APIهای Prompt and Writing Assistance را در Microsoft Edge با مدل زبان Phi-4-mini معرفی کردیم. از آن زمان، ما از توسعهدهندگان وب شنیدهایم، بازخورد شما را لحاظ کردهایم و قابلیتهای هوش مصنوعی Edge را با مدلها و APIهای جدید گسترش دادهایم.
امروز سه بهروزرسانی را معرفی میکنیم:
- پیشنمایش برنامهنویس از پیشنشر Aion-1.0-Instruct مدل زبان کوچک برای تست اولیه و بازخورد.
- این آشکارساز زبان و API های مترجم در Edge 148، که توسط مدلهای روی دستگاه، مخصوص کار، پشتیبانی میشود.
- تجربی تشخیص گفتار روی دستگاه با Web Speech API که در کانالهای Edge Canary و Dev موجود است.
پیش نمایش برنامه نویس Aion-1.0-Instruct
در سال گذشته، APIهای Prompt and Writing Assistance از Phi-4-mini استفاده کرده اند. بسیار توانمند مدل زبان با پارامتر 4B، در Edge. در حالی که درک متن قوی، استدلال و پیروی از دستورالعمل ها را برای سناریوهای وب ارائه می دهد، مدل الزامات سخت افزاری در دسترس بودن آن را در بین دستگاه ها محدود کرده اند.
امروز، ما یک پیشنمایش توسعهدهنده از پیشنشر را معرفی میکنیم Aion-1.0-Instruct مدل زبان کوچک در کانال های Edge Canary و Dev. این مدل زبان کوچکتر، سریعتر و کارآمدتر است. این پشتیبانی را به دستگاههای بیشتری گسترش میدهد – از جمله دستگاههایی که پردازندههای گرافیکی کمتری دارند و از طریق استنتاج CPU، دستگاههای بدون GPU – در حالی که کیفیت بالایی را برای طیف گستردهای از موارد استفاده وب ارائه میکند.
این پیشنمایش به شما امکان میدهد تا Aion-1.0-Instruct را در سناریوهای وب دنیای واقعی ارزیابی کنید، قابلیت همکاری API را آزمایش کنید، و بازخوردی ارائه دهید که بهینهسازیهای نهایی را پیش از انتشار برنامهریزی شده منبع باز برنامهریزی شده آن در Hugging Face در ماه جولای راهنمایی میکند. برای امتحان کردن مدل، اسناد مربوط به آن را بررسی کنید Prompt API و APIهای کمک نوشتن، آزمایش با نمونه های زمین بازی، و نظرات خود را در مورد آن به اشتراک بگذارید GitHub.
API های آشکارساز زبان و مترجم در Edge 148
این آشکارساز زبان و مترجم APIها وبسایتها و افزونههای مرورگر را قادر میسازند تا زبان متن را شناسایی کرده و بین جفتهای زبان ترجمه کنند. این APIها اکنون در Edge 148 در دسترس هستند که توسط مدلهای روی دستگاه و مخصوص کار که مستقیماً در مرورگر ساخته شدهاند، پشتیبانی میشوند. آنها ترجمه سریع و با کیفیت را ارائه می دهند، از بیش از 145 زبان پشتیبانی می کنند و برای حجم کار ترجمه در وب بهینه شده اند.
شما می توانید از این API ها از جاوا اسکریپت در سایت یا برنامه افزودنی خود استفاده کنید و در مقایسه با سرویس های مبتنی بر ابر، حریم خصوصی کاربر، استقلال شبکه و هزینه ترجمه صفر را به دست آورید.
در ساده ترین شکل، زبان شناساگر و API های مترجم را می توان به صورت زیر استفاده کرد:
// Create a Language Detector session.
const detector = await LanguageDetector.create();
// Detect the language of the text.
const results = await detector.detect(userText);
// Use the results.
for (const result of results) {
// Show the full list of potential languages with their likelihood,
// ranked from most likely to least likely.
console.log(result.detectedLanguage, result.confidence);
}
// Create a Translator session.
const translator = await Translator.create({
sourceLanguage: "es",
targetLanguage: "en"
});
// Translate the text and wait for the translation to be done.
const translatedText = await translatorSession.translate(userText);
// Use the translation.
console.log(translatedText);
برای کسب اطلاعات بیشتر، اسناد مربوط به آن را بررسی کنید API آشکارساز زبان و API مترجم، ما را امتحان کنید نمونه های زمین بازی، و بازخورد خود را در آشکارساز زبان و مترجم مشکلات بازخورد در GitHub.
تشخیص گفتار روی دستگاه با Web Speech API
این Web Speech API به شما امکان می دهد ورودی صوتی یا صوتی را در وب سایت ها و برنامه های افزودنی مرورگر اضافه کنید. این API معمولاً توسط سرویسهای مبتنی بر ابر برای تشخیص گفتار (گفتار به متن) و ترکیب (متن به گفتار) پشتیبانی میشود.
در جدیدترین کانالهای Edge Canary و Dev، ما یک مدل مخصوص کار را معرفی میکنیم که گفتار را به صورت محلی در دستگاه کاربر پردازش میکند. این پیادهسازی بر روی دستگاه، حریم خصوصی کاربر را بهبود میبخشد، تأخیر را کاهش میدهد و سناریوهایی با اتصال کم که نیاز به استقلال شبکه دارند را باز میکند.
استفاده از قابلیت جدید تشخیص گفتار روی دستگاه فقط به بهروزرسانیهای جزئی کد Web Speech API موجود شما نیاز دارد، همانطور که نشان داده شده است:
// Create a SpeechRecognition instance. const recognition = new SpeechRecognition(); recognition.lang = 'en-US'; // Use on-device speech recognition. recognition.processLocally = true; // Start speech recognition. recognition.start();
برای شروع کار با تشخیص گفتار روی دستگاه، این را بررسی کنید مستندات، امتحان کنید دمو زمین بازی، و نظرات خود را در مورد آن به اشتراک بگذارید GitHub.
آن را امتحان کنید و به ما اطلاع دهید
با مدل زبان کوچک Aion-1.0-Instruct، API های جدید تشخیص دهنده و مترجم زبان، و تشخیص گفتار روی دستگاه در مایکروسافت اج، می توانید بدون تکیه بر سخت افزار تخصصی، خدمات ابری یا تخصص خاص دامنه، تجربه های وب مبتنی بر هوش مصنوعی را با استفاده از مدل های ساخته شده در مرورگر ایجاد کنید.
ما از شما دعوت می کنیم که این قابلیت ها را کشف کنید، مدل های جدید را آزمایش کنید و به ما بگویید چه چیزی می سازید. بازخورد شما تکرار بعدی هوش مصنوعی روی دستگاه در مایکروسافت اج را شکل خواهد داد، و ما هیجان زده هستیم که با شما همکاری کنیم، زیرا همچنان به گسترش آنچه برای هوش مصنوعی در وب امکان پذیر است ادامه می دهیم.
سایت محتوا مارکتینگ
برای دیدن مطالب آموزشی بیشتر در زمینه سخت افزار و نرم افزار اینجا کلیک کنید!
