Skype Translator কিভাবে কাজ করে

সুচিপত্র:
- প্রযুক্তি যা এটি সম্ভব করে
- কয়েক সেকেন্ডের মধ্যে একটি কথ্য ভাষা থেকে অন্য ভাষাতে
- একটি সূচনা বিন্দু হিসেবে পরীক্ষা প্রোগ্রাম
সায়েন্স ফিকশন প্রযুক্তিগতভাবে উন্নত ডিভাইসগুলির উল্লেখে পূর্ণ যার অপারেশন, পৌরাণিক অভিব্যক্তিকে ব্যাখ্যা করার জন্য, যাদু থেকে আলাদা করা যায় না। তাদের লেখকদের সৃজনশীল মন থেকে উদ্ভূত, যখন এই ধরনের উদ্ভাবনগুলি আমাদের হাতে থাকতে পারে এবং আমরা তাদের অস্তিত্ব আমাদের জীবনচক্রের অংশ হয়ে উঠবে না তা মেনে নিতে পারি তা কল্পনা করা কঠিন। কিন্তু প্রতিবারই তাদের মধ্যে একজন অকালে আমাদের জীবনে লুকোচুরি করে। এটি হল রিয়েল-টাইম অনুবাদ যা মাইক্রোসফ্ট এবং স্কাইপ সম্ভব করতে চলেছে
"কাজটি সহজ ছাড়া অন্য কিছু।এতে ভিডিও কনফারেন্সে স্কাইপের ক্ষমতা, মাইক্রোসফট অ্যাজুরের ক্লাউড সার্ভারের বিশাল নেটওয়ার্ক, মাইক্রোসফট রিসার্চের প্রযুক্তিগত উদ্ভাবন এবং পরিসংখ্যান এবং মেশিন লার্নিংয়ের মতো একাধিক ক্ষেত্রে সাম্প্রতিক অগ্রগতি জড়িত। এই সমস্ত আপনার পরিষেবাতে রাখা হয়েছে যাতে, আপনি আপনার ভাষায় একটি বাক্য উচ্চারণ করার সাথে সাথে, সিস্টেমটি আপনি যা বলেন তা সনাক্ত করে, এটি অনুবাদ করে এবং একটি ভিন্ন ভাষায় আপনার পরিচিতিতে প্রেরণ করে। কিভাবে এটা সম্ভব?"
প্রযুক্তি যা এটি সম্ভব করে
Skype Translator, যে নামে নতুন কার্যকারিতা জানা যায়, তা প্যানে ফ্ল্যাশ নয়, এমনকি এক বছরেও নয় . স্কাইপ অনুবাদক হল বক্তৃতা শনাক্তকরণ, মেশিন অনুবাদ এবং মেশিন লার্নিং কৌশলগুলিতে কয়েক দশকের গবেষণার ফলাফল। এই সমস্ত ক্ষেত্রে এমন একটি সিস্টেমের ক্রিয়াকলাপ রয়েছে যা তাদের মধ্যে সর্বশেষ অগ্রগতি ছাড়া সম্ভব হত না।
স্কাইপ অনুবাদক হল বক্তৃতা শনাক্তকরণ, মেশিন অনুবাদ এবং মেশিন লার্নিং কৌশলগুলিতে কয়েক দশকের গবেষণার ফলাফল।Speech Recognition দিয়ে শুরু হচ্ছে, এমন একটি প্রযুক্তি যা কিছু সময়ের জন্য তদন্তের অধীনে রয়েছে কিন্তু যার গ্রহণ সবসময়ই বিপুল সংখ্যক দ্বারা প্রভাবিত হয়েছে বিদ্যমান সিস্টেমের ত্রুটি এবং অত্যধিক সংবেদনশীলতা। সন্দেহের এক সেকেন্ড, উচ্চারণে ছোট বৈচিত্র্য, বা একটি ন্যূনতম শব্দ কম্পিউটারকে বিভ্রান্ত করতে এবং এটি কী চায় তা বোঝার জন্য যথেষ্ট ছিল। 'ডিপ লার্নিং' কৌশলের বিকাশ এবং কৃত্রিম নিউরাল নেটওয়ার্কের বিস্ফোরণ পর্যন্ত এটি এমনই ছিল, যার মধ্যে মাইক্রোসফ্ট রিসার্চ কিছু জানে। তাদের ধন্যবাদ, এটি যথেষ্ট পরিমাণে ত্রুটির হার হ্রাস করা সম্ভব হয়েছে এবং বক্তৃতা শনাক্তকরণের নির্ভরযোগ্যতা এবং দৃঢ়তা উন্নত করা সম্ভব হয়েছে, স্কাইপ অনুবাদকের কাজ করার জন্য একটি প্রয়োজনীয় প্রথম পদক্ষেপ।
মেশিন অনুবাদ হল অন্য সুস্পষ্ট স্তম্ভ যার উপর স্কাইপ ট্রান্সলেটর অবস্থান করে। এখানে মাইক্রোসফ্ট আবার ইন-হাউস প্রযুক্তি ব্যবহার করে এবং এক ভাষা থেকে অন্য ভাষায় পাঠ্য অনুবাদ করতে Bing অনুবাদ ইঞ্জিন ব্যবহার করে।তার সিস্টেম ফলাফল পরিমার্জিত করার জন্য সিনট্যাক্স স্বীকৃতি কৌশল এবং পরিসংখ্যান মডেলের সমন্বয় ব্যবহার করে। উপরন্তু, এই উপলক্ষ্যে, ইঞ্জিনকে বিশেষভাবে প্রশিক্ষিত করা হয়েছে কথ্য কথোপকথনে যে ধরনের ভাষার ধরন হয় তা চিনতে, সঠিকতা এবং পরিচ্ছন্নতা থেকে অনেক দূরে যা সাধারণত লিখিতভাবে অনুমান করা হয়। এইভাবে, স্কাইপ ট্রান্সলেটর সিস্টেমটি বিং ট্রান্সলেটরের বিশাল ভাষা জ্ঞানের ভিত্তি এবং সাধারণভাবে কথ্য ভাষায় ব্যবহৃত শব্দ এবং বাক্যাংশের একটি বিস্তৃত স্তরকে একত্রিত করে৷
কিন্তু বক্তৃতা এবং ভাষা জটিল ভূখণ্ড। তারা ক্রমাগত পরিবর্তিত হয়, তারা একাধিক স্বাদ এবং বৈচিত্র্যে আসে, প্রতিটি ব্যক্তির নিজস্ব বিশেষ শৈলী আছে ইত্যাদি। স্কাইপ ট্রান্সলেটরকে এই সমস্ত কিছুর সাথে তাল মিলিয়ে চলতে হবে, স্পিচ রিকগনিশন এবং মেশিন ট্রান্সলেশন উভয়েরই অবিরাম প্রশিক্ষণ এবং অপ্টিমাইজেশন প্রয়োজন। এটি করার জন্য সিস্টেমটি একটি শক্তিশালী 'মেশিন লার্নিং' প্ল্যাটফর্মে তৈরি করা হয়েছে, কৃত্রিম বুদ্ধিমত্তার একটি শাখা যার লক্ষ্য এমন কৌশলগুলি তৈরি করা যা মেশিন এবং অ্যালগরিদমকে শিখতে দেয়। নমুনা ডেটা সহ প্রশিক্ষণের মাধ্যমে।এই কৌশলগুলির ব্যবহার, পরিসংখ্যানের ক্ষেত্রে সাধারণ, এটি ব্যবহার করার সময় পরিষেবাটিকে উন্নত করার অনুমতি দেয়, বাক স্বীকৃতি এবং স্বয়ংক্রিয় অনুবাদকে আরও পরিমার্জিত করতে এটি ব্যবহার করার সময় উৎপন্ন ডেটার সুবিধা গ্রহণ করে৷
এই পরীক্ষার কিছু ডেটা স্বয়ংক্রিয়ভাবে বিভিন্ন উৎস থেকে তৈরি হয়, যার মধ্যে রয়েছে সামাজিক নেটওয়ার্ক যেমন Facebook, অনূদিত ওয়েব পেজ, সাবটাইটেল সহ ভিডিও বা এমনকি কথোপকথন এই উদ্দেশ্যে তৈরি করা হয় এবং ম্যানুয়ালি প্রতিলিপি করা ও অনুবাদ করা হয়। . কিন্তু ডেটার আরেকটি অংশ সেবার মাধ্যমে অনুষ্ঠিত প্রকৃত কথোপকথন থেকে আসে। এটি গুরুত্বপূর্ণ কারণ, মাইক্রোসফ্ট প্রতিটি কলের সাথে আপনাকে অবহিত করে, আপনার জানা উচিত যে Skype অনুবাদক কথোপকথন রেকর্ড করতে পারে, সেগুলিকে বেনামী রেখে, যাতে সেগুলি পরে তার অ্যালগরিদম দ্বারা বিশ্লেষণ করা যায়এবং তাদের পরিসংখ্যানগত মডেলের প্রশিক্ষণ প্রক্রিয়ায় চালু করা হয়েছে।
Skype Translator শুধুমাত্র সঠিকভাবে কাজ করতে পারে যদি এটি বাস্তব মানুষের কথোপকথনে এর ব্যবহারের উপর ভিত্তি করে একটি প্রক্রিয়ার মাধ্যমে শিখতে সক্ষম হয়
"এই শেখার প্রক্রিয়া ছাড়া সিস্টেমটি কাজ করতে পারে না। মানুষ যখন কথা বলে আমরা কিছু থেমে যাই এবং পুনরাবৃত্তি করি, ভুল করি এবং চলতে চলতে আমাদের চিন্তাভাবনা পরিবর্তন করি, ahs, ehms, uhms>এর আসল ব্যবহার সম্পর্কে শিখলেই এটি আরও ভাল হতে পারে"
কয়েক সেকেন্ডের মধ্যে একটি কথ্য ভাষা থেকে অন্য ভাষাতে
এই সমস্ত অগ্রগতি দ্বারা সমর্থিত, মূল বিষয় হল স্কাইপ অনুবাদক ব্যবহারকারীর জন্য দ্রুত এবং স্বচ্ছভাবে সম্পূর্ণ স্বীকৃতি এবং অনুবাদ প্রক্রিয়া সম্পাদন করতে সক্ষম হয় প্রতিবার যখন আমরা কথা বলি, সিস্টেমকে অবশ্যই আমরা যা বলছি তা চিনতে হবে, প্রাপকের ভাষায় এটি অনুবাদ করতে হবে এবং তাকে এমনভাবে যোগাযোগ করতে হবে যাতে আমরা প্রাথমিকভাবে যা যোগাযোগ করার চেষ্টা করছিলাম তার প্রতি বিশ্বস্ত থাকে।মধ্যবর্তী ধাপগুলো যত কম লক্ষ্য করব ততই ভালো।
যদি সিস্টেম শনাক্ত করে যে আমরা কথা বলছি এটি আমরা যা বলি তা রেকর্ড করতে শুরু করে এবং স্পীচ শনাক্তকরণ প্রক্রিয়া শুরু করে এটি নয় আমরা যে প্রতিটি শব্দ উচ্চারণ করছি তা কেবল চিনতেই নয়, অতিরিক্ত সব কিছু দূর করতে, অর্থহীন অভিব্যক্তি এবং শব্দ মুছে ফেলা, বাক্যে পাঠ্যের বিভাজন শনাক্ত করা, বিরাম চিহ্ন এবং বড় অক্ষর অন্তর্ভুক্ত করা এবং এটিকে একটি প্রসঙ্গ সরবরাহ করা। যে আপনার ব্যাখ্যা সাহায্য করে. একটু চিন্তা করলেই বুঝতে পারবেন কথ্য ভাষা থেকে এই সব নির্ণয় করা কতটা কঠিন।
স্কাইপ ট্রান্সলেটরের প্রয়োজন যে স্পীচ রিকগনিশন যথাসম্ভব নির্ভুল হওয়া, কারণ নিম্নলিখিতটি হল সংগৃহীত তথ্যকে উন্নত করা পরিসংখ্যানগত মডেলের সাথে তুলনা করার জন্য প্রস্তুত করা এর 'মেশিন লার্নিং' সিস্টেমের মাধ্যমে।এখানে প্রক্রিয়াটির মধ্যে রয়েছে সিস্টেম যা বুঝতে পেরেছে যে আমরা বলছি এবং মডেলগুলিতে থাকা শব্দ এবং প্রসঙ্গগুলির মধ্যে মিল খুঁজে বের করা, পরবর্তীতে পূর্বে শেখা রূপান্তরগুলি প্রয়োগ করা যা অডিওটিকে পাঠ্যে রূপান্তরিত করবে এবং বিদেশী ভাষায় অনুবাদ করবে।
চূড়ান্ত ধাপে, স্কাইপ এক জোড়া বট প্রস্তুত করেছে, নারী ও পুরুষ কণ্ঠস্বর, যা কলে দোভাষী হিসেবে কাজ করে একবার ব্যবহারকারীর দ্বারা একজনকে নির্বাচিত করা হলে, তিনি আমাদের অনূদিত বার্তাটি রিসিভারের সাথে যোগাযোগের দায়িত্বে থাকবেন, যাতে কেবলমাত্র লিখিত প্রতিলিপি এবং অনুবাদগুলি স্ক্রিনে প্রদর্শিত হয় না, তবে তিনি সেগুলিকে উচ্চস্বরে শুনতে পারেন যেন একজন তৃতীয় মানুষ। আমাদের মধ্যে মধ্যস্থতাকারী.. এই বটগুলি দ্রুত বার্তাটি যোগাযোগ করতে সক্ষম, যাতে যে কেউ স্ক্রিনের অন্য দিকে শুনছে আমরা এটি উচ্চারণের কয়েক সেকেন্ড পরে বার্তাটি গ্রহণ করে।
একটি সূচনা বিন্দু হিসেবে পরীক্ষা প্রোগ্রাম
কথোপকথনে তৃতীয় পক্ষের স্পিকার হিসাবে বটগুলির উপস্থিতি এমন একটি বিবরণ যা এখনও পালিশ করা বাকি রয়েছে৷ মাইক্রোসফ্ট স্বীকার করে যে দোভাষীর মাধ্যমে কথা বলতে অভ্যস্ত লোকদের জন্য তাদের সাথে খাপ খাইয়ে নেওয়া সহজ, কিন্তু অন্যদের জন্য এটি শেখার সময় প্রয়োজন। এবং এটি হল যে মাইক্রোসফ্ট এবং স্কাইপ বিদ্যমান সেরা রিয়েল-টাইম অনুবাদ অভিজ্ঞতা তৈরি করতে দৃঢ়প্রতিজ্ঞ হতে পারে, কিন্তু তা করার জন্য তাদের আমাদের নিজেদের এবং মেশিন উভয়কেই শিখতে হবেস্কাইপ ট্রান্সলেটর প্রিভিউ সেই প্রক্রিয়ার আরও একটি ধাপ।
পরীক্ষা প্রোগ্রামটি ডিসেম্বরের মাঝামাঝি সময়ে লাইভ হয়েছিল, প্রবর্তন করেছে দুটি ভাষায় কথ্য অনুবাদ: ইংরেজি এবং স্প্যানিশ, এবং 40টিরও বেশি ভাষায় লিখিত অনুবাদএটি অ্যাক্সেস করার জন্য, একটি আমন্ত্রণ প্রয়োজন, যা আমরা প্রোগ্রামের ওয়েবসাইটে নিবন্ধন করে অনুরোধ করতে পারি। যদি আমরা এটির সাথে প্রশংসিত হই তবে আমরা উইন্ডোজ 8 এর জন্য স্কাইপ অ্যাপ্লিকেশনগুলি থেকে স্কাইপ অনুবাদক চেষ্টা করতে পারি।1 বা Windows 10 প্রযুক্তিগত পূর্বরূপ। অন্যথায় আমাদের পরিষেবা সম্প্রসারিত এবং আনুষ্ঠানিকভাবে প্রকাশ করার জন্য অপেক্ষা করতে হবে৷
"যাইহোক, স্কাইপ ট্রান্সলেটর চালু হয়েছে ঠিক যখন আমরা 2014 কে বিদায় জানাতে যাচ্ছি। শেষ করার আগে, এখানে এক সেকেন্ডের জন্য থামুন এবং আপনি যে বছরটি পড়েছেন সে সম্পর্কে চিন্তা করুন: দুই হাজার চৌদ্দ৬৪৩৩৪৫২"
ভায়া | স্কাইপ ব্লগ I, II