বিল্ট-ইন AI দিয়ে শুরু করুন

অনুসরণ
Alexandra Klepper

প্রকাশিত: ১২ ডিসেম্বর, ২০২৪, সর্বশেষ আপডেট: ২০ মে, ২০২৫

বিল্ট-ইন AI API গুলির সাহায্যে, আপনার ওয়েব অ্যাপ্লিকেশন নিজস্ব AI মডেল স্থাপন বা পরিচালনা করার প্রয়োজন ছাড়াই AI-চালিত কাজগুলি সম্পাদন করতে পারে। আমরা ব্রাউজারগুলিতে এই API গুলিকে মানসম্মত করার জন্য কাজ করছি।

আবশ্যকতা

অন্তর্নির্মিত AI ব্যবহার করার জন্য, মডেল এবং হার্ডওয়্যারের প্রয়োজনীয়তা রয়েছে।

মডেল

অনুবাদক এবং ভাষা সনাক্তকারী API গুলি বিশেষজ্ঞ মডেল ব্যবহার করে। অন্যান্য সমস্ত API গুলি একটি ভাষা মডেল ব্যবহার করে, যা ডেস্কটপ এবং ল্যাপটপে স্থানীয়ভাবে চালানোর জন্য ডিজাইন করা হয়েছে।

Summarizer API, Writer API, Rewriter API, এবং Proofreader API, শুধুমাত্র টেক্সট-টু-টেক্সট মোডালিটি সমর্থন করে। Prompt API-তে মাল্টিমোডাল ক্ষমতা রয়েছে

ক্রোমে জেমিনি ন্যানো

ক্রোম জেমিনি ন্যানো ভাষার মডেল ব্যবহার করে। জেমিনি ন্যানো মোবাইল ডিভাইসে উপলব্ধ নয়।

ক্রোম ১৪০ থেকে, জেমিনি ন্যানো ইনপুট এবং আউটপুট টেক্সটের জন্য ইংরেজি, স্প্যানিশ এবং জাপানি ভাষা সমর্থন করে।

বিল্ট-ইন এআই এপিআই ব্যবহার করার আগে, গুগলের জেনারেটিভ এআই নিষিদ্ধ ব্যবহার নীতি স্বীকার করুন।

হার্ডওয়্যার

Chrome-এ এই API গুলি ব্যবহার করে বৈশিষ্ট্যগুলি পরিচালনাকারী ডেভেলপার এবং ব্যবহারকারীদের জন্য নিম্নলিখিত প্রয়োজনীয়তাগুলি বিদ্যমান। অন্যান্য ব্রাউজারগুলির বিভিন্ন অপারেটিং প্রয়োজনীয়তা থাকতে পারে।

ল্যাঙ্গুয়েজ ডিটেক্টর এবং ট্রান্সলেটর এপিআই ডেস্কটপে ক্রোমে কাজ করে। এই এপিআইগুলি মোবাইল ডিভাইসে কাজ করে না। প্রম্পট এপিআই, সামারাইজার এপিআই, রাইটার এপিআই, রিরাইটার এপিআই এবং প্রুফরিডার এপিআই ক্রোমে কাজ করে যখন নিম্নলিখিত শর্তগুলি পূরণ হয়:

  • অপারেটিং সিস্টেম : Windows 10 অথবা 11; macOS 13+ (Ventura এবং পরবর্তী); Linux; অথবা ChromeOS (প্ল্যাটফর্ম 16389.0.0 এবং পরবর্তী) Chromebook Plus ডিভাইসে। Android, iOS এবং Chromebook Plus নয় এমন ডিভাইসে ChromeOS এখনও Gemini Nano ব্যবহার করে এমন API দ্বারা সমর্থিত নয়।
  • স্টোরেজ : আপনার Chrome প্রোফাইল ধারণকারী ভলিউমে কমপক্ষে ২২ গিগাবাইট খালি জায়গা।
  • GPU অথবা CPU : অন্তর্নির্মিত মডেলগুলি GPU অথবা CPU দিয়ে চলতে পারে।
    • জিপিইউ : ৪ জিবি-র বেশি ভিআরএএম।
    • সিপিইউ : ১৬ জিবি বা তার বেশি র‍্যাম এবং ৪টি সিপিইউ কোর বা তার বেশি।
  • নেটওয়ার্ক : সীমাহীন ডেটা অথবা একটি মিটারবিহীন সংযোগ।

ব্রাউজার মডেল আপডেট করার সাথে সাথে জেমিনি ন্যানোর সঠিক আকার পরিবর্তিত হতে পারে। বর্তমান আকার নির্ধারণ করতে, chrome://on-device-internals দেখুন।

নির্মাণ শুরু করুন

উন্নয়নের বিভিন্ন পর্যায়ে বেশ কিছু বিল্ট-ইন AI API উপলব্ধ রয়েছে। কিছু Chrome স্থিতিশীল, কিছু অরিজিন ট্রায়ালের জন্য উপলব্ধ অংশগ্রহণকারী, এবং অন্যগুলি শুধুমাত্র Early Preview Program অংশগ্রহণকারীদের জন্য উপলব্ধ।

প্রতিটি API-এর নিজস্ব নির্দেশাবলীর সেট থাকে যাতে মডেলটি শুরু করা যায় এবং ডাউনলোড করা যায়, স্থানীয় প্রোটোটাইপিং এবং অরিজিন ট্রায়াল সহ উৎপাদন পরিবেশে।

Chrome এক্সটেনশন তৈরি করার সময় এই সমস্ত API ব্যবহার করা যেতে পারে।

মডেল ডাউনলোড

API গুলি Chrome-এ তৈরি করা হয়, যেমন মডেলগুলি। প্রথমবার যখন কোনও ব্যবহারকারী এই API গুলির সাথে ইন্টারঅ্যাক্ট করেন, তখন মডেলটি ব্রাউজারে ডাউনলোড করতে হবে।

একটি API ব্যবহারযোগ্য এবং প্রস্তুত কিনা তা নির্ধারণ করতে, অ্যাসিঙ্ক্রোনাস availability() ফাংশনটি কল করুন, যা নিম্নলিখিত মানগুলির মধ্যে একটি সহ একটি প্রতিশ্রুতি প্রদান করে:

  • "unavailable" : ব্যবহারকারীর ডিভাইস বা অনুরোধ করা সেশন বিকল্পগুলি সমর্থিত নয়। ডিভাইসটিতে পর্যাপ্ত শক্তি বা ডিস্ক স্থান নাও থাকতে পারে।
  • "downloadable" : একটি সেশন তৈরি করতে অতিরিক্ত ডাউনলোডের প্রয়োজন হয়, যার মধ্যে একটি বিশেষজ্ঞ মডেল, একটি ভাষা মডেল, অথবা সূক্ষ্ম-টিউনিং অন্তর্ভুক্ত থাকতে পারে। create() কল করার জন্য ব্যবহারকারী সক্রিয়করণের প্রয়োজন হতে পারে।
  • "downloading" : ডাউনলোডগুলি চলছে এবং একটি সেশন ব্যবহার করার আগে অবশ্যই সম্পূর্ণ করতে হবে।
  • "available" : আপনি অবিলম্বে একটি সেশন তৈরি করতে পারেন।

ব্যবহারকারী সক্রিয়করণ

যদি ডিভাইসটি বিল্ট-ইন AI API সমর্থন করতে পারে, কিন্তু মডেলটি এখনও ডাউনলোড না করা হয়, তাহলে ব্যবহারকারীকে অবশ্যই আপনার পৃষ্ঠার সাথে অর্থপূর্ণভাবে ইন্টারঅ্যাক্ট করতে হবে যাতে আপনার অ্যাপ্লিকেশনটি create() দিয়ে একটি সেশন শুরু করতে পারে।

পৃষ্ঠাটি লোড হওয়ার পর থেকে ব্যবহারকারী সরাসরি পৃষ্ঠাটির সাথে ইন্টারঅ্যাক্ট করেছেন কিনা তা নিশ্চিত করতে UserActivation.isActive প্রপার্টি ব্যবহার করুন। এর মধ্যে ট্যাপ, ক্লিক, কী প্রেস, mousedown বা অন্যান্য স্টিকি অ্যাক্টিভেশন ইভেন্ট অন্তর্ভুক্ত থাকতে পারে।

// Check for user activation.
if (navigator.userActivation.isActive) {
  // Create an instance of a built-in API
}

উদাহরণস্বরূপ, Summarizer API এর ক্ষেত্রে, আপনি ব্যবহারকারীদের Summarizer.create() সক্রিয় করার জন্য "Summarize" লেখা একটি বোতাম ব্যবহার করে ইন্টারঅ্যাক্ট করতে বলতে পারেন, অথবা ব্যবহারকারী টাইপ করা শুরু করার পরে একটি keydown ইভেন্টের জন্য summarizer তৈরি করতে পারেন।

লোকালহোস্টে API ব্যবহার করুন

সমস্ত API গুলি Chrome-এর localhost এ উপলব্ধ।

  1. chrome://flags/#prompt-api-for-gemini-nano-multimodal-input এ যান।
  2. সক্রিয় নির্বাচন করুন।
  3. Chrome পুনরায় চালু করুন বা পুনরায় চালু করুন ক্লিক করুন।

জেমিনি ন্যানো ডাউনলোড হয়েছে এবং ঠিক যেমনটি ইচ্ছা তেমন কাজ করছে তা নিশ্চিত করতে, DevTools খুলুন এবং কনসোলে await LanguageModel.availability(); টাইপ করুন। এটি available ফিরে আসবে।

লোকালহোস্টের সমস্যা সমাধান করুন

যদি মডেলটি প্রত্যাশা অনুযায়ী কাজ না করে, তাহলে এই পদক্ষেপগুলি অনুসরণ করুন:

  1. ক্রোম রিস্টার্ট করুন।
  2. chrome://on-device-internals এ যান।
  3. মডেল স্ট্যাটাস ট্যাবটি নির্বাচন করুন এবং নিশ্চিত করুন যে কোনও ত্রুটি নেই।
  4. DevTools খুলুন এবং কনসোলে LanguageModel.availability(); টাইপ করুন। এটি available ফিরে আসবে।

প্রয়োজনে, কিছুক্ষণ অপেক্ষা করুন এবং এই ধাপগুলি পুনরাবৃত্তি করুন।

মান প্রক্রিয়া

আমরা এই API গুলিকে স্ট্যান্ডার্ডাইজ করার জন্য কাজ করছি, যাতে এগুলি সমস্ত ব্রাউজারে কাজ করে। এর অর্থ হল আমরা API গুলিকে ওয়েব প্ল্যাটফর্ম কমিউনিটিতে প্রস্তাব করেছি এবং আরও আলোচনার জন্য W3C ওয়েব ইনকিউবেটর কমিউনিটি গ্রুপে স্থানান্তর করেছি।

আমরা প্রতিটি API-এর জন্য W3C, Mozilla এবং WebKit-এর কাছ থেকে প্রতিক্রিয়া অনুরোধ করছি।

অংশগ্রহণ করুন এবং মতামত শেয়ার করুন

আপনি যদি বিল্ট-ইন AI ব্যবহার করে দেখেন এবং আপনার প্রতিক্রিয়া থাকে, তাহলে আমরা তা শুনতে আগ্রহী।