ফরেনসিক লিঙ্গুস্টিকস

শুরু করি ২০০৯ সালে যুক্তরাজ্যে ঘটে যাওয়া একটি ঘটনা দিয়ে। যুক্তরাজ্যের  লোকাল এরিয়ার একটি বাসায় আগুন লেগে গিয়েছিল। বাসায় থাকা ক্রিস্টোফার বার্ক তার দুই সন্তান নিয়ে বেরিয়ে আসতে পারলেও দুর্ভাগ্যবশত তার স্ত্রী অ্যামেন্ডা মারা যান। এ ঘটনায় ঐ এলাকার মানুষজন শোকাহত হন। পুলিশ তদন্তে নামলে দেখতে পায় যে অ্যামেন্ডার মৃতদেহ যেভাবে পড়ে রয়েছে তা কোন পুড়ে যাওয়া মৃতদেহের মত নয়। ফরেনসিক টেস্ট করে দেখা যায় তিনি আগুন লাগার পূর্বেই মারা গিয়েছিলেন। কিন্তু কোন ক্লু তদন্তকারীরা খুঁজে পাচ্ছিলেন না। তাদের প্রশ্ন জাগে কিভাবে এবং কখন অ্যামেন্ডা খুন হলেন?


অ্যামেন্ডা খুন হওয়ার কিছুদিন আগে প্রায় ডজনখানেক ম্যাসেজ তার পরিবারের বাকি সদস্যরাও পেয়েছিল। পরিবারের সদস্যদের মনে সন্দেহ হয় এই ম্যাসেজগুলি অ্যামেন্ডার লেখা ম্যাসেজ নয়। এটি পুলিশকে জানানো হলে আরেকটি প্রশ্নের উদ্রেক হয় তাহলে অ্যামেন্ডার ফোন থেকে ম্যাসেজ কে পাঠিয়েছিল? এবার সন্দেহের তীর অ্যামেন্ডার স্বামী ক্রিস্টোফারের দিকে ঝুঁকে। তদন্তের জন্য গোয়েন্দারা ফরেনসিক ভাষাবিদ টিম গ্রান্টের সাহায্যে নেন। প্রফেসর টিম গ্রান্ট ঐ ডজন খানেক ম্যাসেজসহ অ্যামেন্ডার কলিগ এবং বন্ধুদের থেকে আরো দুইশত ম্যাসেজ সংগ্রহ করেন এবং ক্রিস্টোফারেরও দুইশত ম্যাসেজ সংগ্রহ করেন। টিম মেসেজগুলো এনালাইসিস করেন। তারপর তিনি প্রমাণ করেন অ্যামেন্ডার লেখা ম্যাসেজ গুলি আসলে ক্রিস্টোফারের লেখা ছিল। তিনি এটা কিভাবে বুঝতে পারলেন? এ সম্পর্কে টিম বলেছিলেন,

“তোমাকে প্রথমে অনেক টেক্সটের নমুনা সংগ্রহ করতে হবে। একজনের লেখার স্টাইল (শৈলী)এর সাথে আরেকজনের লেখার স্টাইল মিলবে না যখন তুমি দুটি আলাদা লেখকের টেক্সট তুলনা করবে।”

নারী–পুরুষের লেখার স্টাইলের মধ্যেও ভিন্নতা রয়েছে। ঐ টেক্সটগুলি কত তারিখ আর কখন পাঠানো হয়েছিল তা যখন আরো এনালাইসিস করা হলো দেখা গেল যে রাত সাড়ে ১২ টার পর আর কোন ম্যাসেজ ছিল না। ধারণা করা হয়, ক্রিস্টোফার তখনই অ্যামেন্ডাকে খুন করেছিল এবং সেটি ধামাচাপা দেয়ার জন্য বাড়িতে আগুন লাগিয়ে  তার সন্তানদের নিয়ে সরে পরে। ফরেনসিক লিঙ্গুস্টিকস খুব ভালভাবে এ ব্যাপারে পুলিশ কে সাহায্যে করে এবং পরবর্তীতে  ক্রিস্টোফার দোষ স্বীকার করে। এবার বর্তমানে আসি। বর্তমানে চলছে তথ্য প্রযুক্তির যুগ। যারা এখন প্রযুক্তিতে এগিয়ে আছে তারাই এখন সবচেয়ে উন্নত। প্রযুক্তি এবং সোশ্যাল মিডিয়ার উন্নতির সাথে সাথে পাল্লা দিয়ে বাড়ছে সাইবার ক্রাইম। এই সাইবার ক্রাইম সংগঠিত হচ্ছে বিভিন্ন স্পাম (spam)ম্যাসেজ, বিভিন্ন আইডি হতে থ্রেট টেক্সট, অ্যানিনোমাস কমেন্টের এর মাধ্যমে। এছাড়াও অনেকেই অনলাইন হ্যারেজমেন্ট এবং বুলিং এর স্বীকার হচ্ছেন। কিছু অনলাইন ক্রাইমের তদন্তে দেখা যায় বিভিন্ন আইডি হতে থ্রেট টেক্সট পাঠানো হলেও তার মূলে আসলে একজন ব্যক্তি। বা হতেও পারে একাধিক ব্যক্তি। এইসব ব্যক্তি এবং ব্যক্তিদের নির্ভুলভাবে শনাক্ত করেন ফরেনসিক ভাষাবিদগণ। নির্ভুল ভাবে বলতে গেলে ব্যক্তি হতে প্রাপ্ত এভিডেন্স দিয়েই তার বয়স, লিঙ্গ এবং ভৌগলিক অবস্থান নির্ণয় সম্ভব। কিন্তু কীভাবে পারেন ফরেনসিক লিঙ্গুইস্টগণ? কীভাবে পরিচালনা করেন তাদের কার্যকালাপ? এটি জানতে হলে ফরেনসিক ভাষাবিজ্ঞান (Forensic Linguistics) সম্পর্কে জানতে হবে।

ফরেনসিক লিঙ্গুস্টিকস কী?

১৯৮০ সালের আগে সারাবিশ্বে ফৌজদারি বিভিন্ন কাজে (তদন্ত বা প্রমাণ) করার জন্য নৃবিজ্ঞানী (Anthropologist), সাইকোলজিস্ট (Psychologist), সমাজবিজ্ঞানী (Sociologist) এবং রাষ্ট্রবিজ্ঞানী(Political scientist) এর প্রয়োজন হত। বিংশ শতাব্দীর শেষের দিকে টেলিকমিউনিকেশন বিপ্লবের পাশাপাশি বিভিন্ন কেসে ভাষাবিজ্ঞানীদের অনেক প্রয়োজন পড়ে। তাই এই লিস্টে এখন ভাষাবিজ্ঞানীগণ অপরিহার্য সদস্য।

ফরেনসিক ভাষাবিজ্ঞান এমন একটি শাস্ত্র যেখানে ফৌজদারি মামলা প্রমাণাদি তদন্তের সুবিধার্থে, ভাষাতাত্ত্বিক সূত্রতত্ত্ব প্রয়োগ করে থাকে

ফরেনসিক ভাষাবিজ্ঞানের শুরুটা বেশ পুরনো। এর প্রথম কেস পাওয়া যায় ১৯২৭ সালে নিউইয়র্কে যেখানে একটি মেয়ে কিডন্যাপড হয় এবং কিডন্যাপাররা মেয়েটির চাচাকে চিঠি দেয়। চিঠিতে চাচার নাম McLure এর বদলে McClure লেখা ছিল। McClure বলে তাকে পরিচিত কেউ ডাকতো। এই সূত্র ধরেই পরবর্তীতে কিডন্যাপারকে ধরা যায়।

তবে আধুনিক ফরেনসিক ভাষাবিজ্ঞানের জনক বলা হয় রিসার্চার রজার স্যু (১৯৩১-বর্তমান)কে।

রজার স্যু; Image Courtesy: rogershuy.com

আমেরিকান এই ভাষাবিদ প্রায় ১৩ টি বই লিখেছেন ভাষাবিজ্ঞানের সাথে আইনের সম্পর্ক নিয়ে এবং প্রায় ৫০০ টি কেইসে সহযোগিতা করেছেন। তিনি ২০০৯ সালে Linguistics Society of America তে ফেলো হিসেবে নির্বাচিত হন।

Forensic linguistics এর শুরু হয়েছিল মূলত Voice Identification বা ধ্বনি নির্ণয়ের মাধ্যমে। সহজ কথায় বলতে গেলে ব্যক্তির আওয়াজ নির্ণয়ের মাধ্যমে। তবে বর্তমানে সবচেয়ে বেশি জনপ্রিয় হল Authorship Profiling বা মূল লেখক নির্ণয়।

অর্থাৎ ফরেনসিক লিঙ্গুইস্টিকস এর দুটি বড় ক্ষেত্র :

        ১.Voice Identification (মূল ধ্বনি নির্ণয়)

       ২. Authorship Profiling (মুল লেখক নির্ণয়)

Voice Identification

ভয়েস আইডেন্টিফিকেশন বা ধ্বনি নির্ণয় কে বর্তমানে Forensic phonetics বলে অভিহিত করা হয়। শেষ বিশ বছরে বহি:বিশ্বে অসংখ্য কেইস এসেছে। জনপ্রিয় ভারতীয় সিরিজ অসুর এ এরকম একটি কেইস দেখা যায়। ভয়েস আইডেন্টিফাই করা হয় মূলত অডিও এবং ভিডিও রেকর্ডিং এর মাধ্যমে এবং এটি খুবই ক্রুশ্যাল রোল প্লে করছে ক্রিমিনাল ট্রায়ালে।

Image Courtesy : cdac.in

Voice or Speaker Identification করা হয় মূলত Combining Auditory এবং Acoustic Analysis এর মাধ্যমে। সহজ ভাষায় বলতে গেলে একজন মানুষ তার পরিচিত সবার সাউন্ড আলাদাভাবে  নির্ণয় করতে পারে  ইন্দ্রিয় দ্বারা। একজন মানুষ আলাদা ভাবে বুঝতে পারে কোনটি তার বাবার, কোনটি তার মায়ের, কোনটি তার বন্ধু কিংবা ভাইবোনের গলার স্বর। ঠিক তেমনি Combining process দ্বারা আলাদাভাবে ভয়েস নির্ণয় করা হয়। Acoustic Analysis এ ধ্বনিটির তরঙ্গ বিশ্লেষণ হয়। প্রতিটি মানুষের ধ্বনি তরঙ্গ, বয়স, লিঙ্গভেদে আলাদা হয়। Acoustic Analysis এর মাধ্যমে ধ্বনি তরঙ্গ, সময়, ফ্রিকোয়েন্সি নির্ণয় করা হয়।

Combining Auditory এবং Acoustic Analysis এর মাধ্যমে একটি স্পিকার প্রোফাইল তৈরি করা যায় যাকে Speaker Profiling বলে। এই প্রোফাইলে ব্যক্তির ধ্বনি বিশ্লেষণের মাধ্যমে তার বয়স, লিঙ্গ এবং সোশ্যাল ব্যাকগ্রাউন্ড চিহ্নিত করা থাকে। সোশ্যাল ব্যাকগ্রাউন্ড টা নির্ণয় করা হয় মূলত তার ভাষার Accent বা Dialect এর উপর ভিত্তি করে। কারণ প্রত্যেক ব্যক্তিই একটি নির্দিষ্ট Accent এ কথা বলে এবং এই এনালাইসিসের ফলে স্পিকারের নিজস্ব চালচলন ধরা যায়।

ভয়েস আইডেন্টিফিকেশনের কিছু টেকনিক্যাল ইস্যু বর্তমানে ব্যবহৃত হচ্ছে। যেমন:

Quality Enhancement: এটি ডিকোড করে অপরাধীদের সেইসব রেকর্ডিং যা খুব নিম্নমানের এবং Noisy। এটি না হলে আসামীপক্ষ সুযোগ নিতে পারতো তবে ডিকোডিং এর ফলে আসল অপরাধী খুঁজে বের করা যায়।

Authentication: জাল রেকর্ড বা রেকর্ডটি আসলেই সন্দেহভাজনের কি না তা নির্ণয়ের মাধ্যমই

হলো Authentication। এটি নির্ণয় করতে যেটির সাহায্যে নিতে হয় তা হল Voice line-up।

Image Courtesy: cops.usdoj.gov

সন্দেহভাজন হতে ভিন্ন ভিন্ন সময়ে ভয়েস রেকর্ড করে নেয়া হয় কেননা আমরা সবসময় একই ধ্বনিতে কথা বলি না। ঠান্ডা মেজাজে আমাদের ধ্বনি একধরনের এবং গরম মেজাজে আমাদের ধ্বনি আরেকধরণের হয়। ধরি অপরাধীর ফিসফিস করা একটি রেকর্ড আমরা পেয়েছি। এটি প্রমাণের জন্য সন্দেহভাজনের ফিসফিসিয়ে কথা বলার রেকর্ড দরকার হবে। এছাড়াও বিভিন্ন ব্যক্তি, লিঙ্গ, বয়সভেদে ভয়েসের তারতম্য ভিন্ন হয় যার ফলে  আলাদা করে ব্যক্তি চিহ্নিত করা সম্ভব হয়। শুধু তাই নয় আমরা প্রতি মিনিটে সবাই একই সংখ্যার শব্দ উচ্চারণ করতে পারি না। কেউ হয়তো পার মিনিটে ১২০ টি শব্দ বলছে আবার কেউ পার মিনিটে ১৫০ টিরও অধিক শব্দ বলতে পারেন। সুতরাং রেকর্ডেড অডিও থেকে শব্দের প্যাটার্ন মিলিয়ে ব্যক্তি চিহ্নিতকরণ সম্ভব।

Authorship Profiling or Forensic Stylistics

একটি টেক্সট এনালাইসিস করেই যদি কোন লেখকের নেটিভ কান্ট্রি, নেটিভ ভাষা, শিক্ষাগত যোগ্যতা এমনকি ব্যক্তিত্ব ধরে ফেলা যায় তবে কেমন হয় ব্যাপারটা!  Authorship Profiling ঠিক এই কাজটিই করে থাকে এবং একে Forensic Stylistics ও বলা হয়। এটি বোঝার জন্য একটি সহজ উদাহরণ দেই। যদি আপনি ক্লাস ফোরের বাচ্চাকে একটি প্যারাগ্রাফ লিখতে দেন এবং একই টপিকে ক্লাস টেনের শিক্ষার্থীকে প্যারাগ্রাফ লিখতে দিলে আপনি কিন্তু আলাদা করতে পারবেন কোনটি কার লেখা। সুতরাং ব্যক্তিভেদে, বয়সভেদে লেখার পদ্ধতিতে তারতম্য ঘটে। এখানে অভিজ্ঞতাও একটি ফ্যাক্টর।
একজন সাইকোলজিস্ট যেমন তার পেশেন্ট এর প্রোফাইল তৈরি করেন ঠিক তেমনি একজন ফরেনসিক ভাষাবিজ্ঞানীও তার সন্দেহভাজনদের ভাষাগত প্রোফাইল তৈরি করেন। একে বলা হয় Authorship Profiling.

Image Courtesy: slideshare.net

Authorship profiling শুরু হয় ফরেনসিক টেক্সট এনালাইসিস এর মাধ্যমে। ফরেনসিক টেক্সট হল অপরাধ সংগঠনের স্থানে প্রাপ্ত টেক্সট। হতে পারে একটি টিকেট, হতে পারে একটি প্রবন্ধ, হতে পারে একটি চিঠি বা হেলথ ডকুমেন্টস।

তবে যে ফরেনসিক টেক্সটগুলি বেশি গুরুত্বপূর্ণ তা হল :

Ransom Demand or Threat Text:  বেনামি পত্র যেখানে হুমকি দেয়া হয়,লিখিত বক্তব্য যা কোনকিছু নির্দেশ করে। সিরিয়াল কিলাররাও মাঝেমধ্য কিছু লিখে যায় যা গুরুত্বপূর্ণ ক্লু হয়ে দাড়ায় ।

Hate Mail: এটি সেলিব্রেটিদের বেলায় বেশি ঘটে। অনেকসময় দেখা যায় তাকে বিভিন্ন ম্যাসেজ দিয়ে হুমকি দেয়া হচ্ছে বা এমনকিছু বলা হচ্ছে যা তার ভাবমূর্তি ক্ষুণ্ন করে। অনেকসময় সেলিব্রেটিরা আতংকিত হয়ে পড়েন।

Suicide Letter: অনেকগুলো কেস পাওয়া গিয়েছে যেখানে ব্যক্তির কাছে সুইসাইড লেটার পাওয়া গেলেও আসলে তাকে মার্ডার করা হয়েছিল। সুতরাং সুইসাইড লেটার একটি গুরুত্বপূর্ণ ফরেনসিক টেক্সট।

Authorship Profiling  করতে দুটি Linguistic Property দরকার হয় একটি Lexis, অপরটি Grammar.


Lexis and Grammar: 
লেক্সিস হলো ফরেনসিক টেক্সট এর ভোকাবুলারি (Vocabulary)। টেক্সটে কোন কোন ভোকাব বেশি ব্যবহার করা হয়েছে তা একটি বড় ক্লু। সবার ভোকাবুলারি এবং ব্যাকরণ প্রয়োগ পদ্ধতি সমান নয়। একজন উচ্চশিক্ষিত, শুধু শিক্ষিত এবং সাধারণ শিক্ষার্থীর  লেক্সিম (Lexim) এবং ব্যকরণ প্রয়োগ একইধরণের হয় না। ব্যক্তিভেদে ভোকাব এবং ব্যাকরণের প্রয়োগে বৈসাদৃশ্য দেখা যায়। এটির সাথে আরেকটি বিষয় গুরুত্বপূর্ণ তা হলো Punctuation.

প্রত্যেক ভাষারই আলাদা বিরামচিহ্নের নিয়ম থাকে। প্রত্যেকেরই একটি নিজস্ব বানানপদ্ধতি (Orthography) রয়েছে। একটি ছেলে যেভাবে লেখে একটি মেয়ে সেভাবে লেখে না। ১৯৩০ সালের একটি কেসে দেখা যায় একটি এশিয়ান স্কোয়াড কিছু মানুষ জিম্মি করে পুলিশকে বিভ্রান্ত করতে অস্ট্রেলিয়ান নেটিভ ভাষায় লিখে রেখে যায়। কিন্তু ঐ লেখায় নেটিভ ভাষার সাথে প্রচুর Lexis, Grammar ও Orthography তে অসামঞ্জস্য দেখা দেয়। যার ফলে পুলিশ নিশ্চিত হয় যে এটা কোন অস্ট্রলিয়ানদের কাজ নয়।


Authorship Profiling শেষ করা যাক একটি বিখ্যাত কেইস দিয়ে। যে ঘটনাটি বিশ্বে ফরেনসিক ভাষাবিজ্ঞান কে সামনে তুলে ধরেছে।

Ted Kaczynski, UNABOMBER Case: ১৯৭৮ সালে সিরিজ বোমা হামলায় কেঁপে উঠে আমেরিকা। যা হয়েছিল মেইল বোম্বিং এর মাধ্যমে। গোয়েন্দারা কোন ক্লুই খুঁজে পাচ্ছিলেন না কে করলো এই কাজ। এতে প্রায় ২৩ জন মারা গিয়েছিলেন। ১৯৮০, ১৯৮২, ১৯৮৫ পর্যন্ত আমেরিকার অনেক শহরে আবার বোমা হামলা হয় সেই মেইলের মাধ্যমেই। যেহেতু বোমা হামলাগুলি বিশ্ববিদ্যালয় এবং এয়ারলাইন্সে হচ্ছিলো তাই এর নাম হয় Unabomber (University +Airlines)।  ১৩০ জনের অধিক এফবিআই এজেন্ট এবং ATP মিলেও এর কুলকিনারা করতে পারছিলো না। ১৯৮৭ সাল পর্যন্ত এটি চললেও থিউডোর কাজানাস্কি (Unabomber)পরবর্তীতে নিশ্চুপ ছিলেন এবং নিজের ভাইয়ের নামে বিভিন্ন পত্রিকায় Manifesto ছাপাতেন। এটিই তার জন্য কাল হয়েছিল। নব্বইয়ের মাঝে ফরেনসিক ভাষাবিজ্ঞানী জেমস ফিজজেরাল্ড যেসব ফরেনসিক টেক্সট পেয়েছিলেন তা এনালাইসিস করে দেখেন এটি একটি পুরুষের লেখা এবং Phrase Analysis করে বুঝতে পারেন লোকটি শিকাগোতে থাকে। ঐ টেক্সটে শিকাগোতে থাকা মানুষরা যেসব Phrase ব্যবহার করে তা লেখা ছিল। জেমস শিকাগো পুলিশের সাহায্যে নিলে তার হাতে আরো কিছু ফরেনসিক টেক্সট আসে। কাজানাস্কির ক্রাইমসীনে পাওয়া ফরেনসিক টেক্সট এবং তার বেনামী পত্রিকার লেখা মিলিয়ে দেখার পর ফরেনসিক ভাষাবিজ্ঞানীরা নিশ্চিত হন যে এখানে দুটি ব্যক্তির আড়ালে মূলত একজন ই। পরবর্তীতে ১৯৯৫ সালে কাজানাস্কি গ্রেফতার হন এবং যাবজ্জীবন কারাদণ্ডে দন্ডিত হন।

ফরেনসিক ভাষাবিজ্ঞান কারা পড়তে পারবেন ?

ফরেনসিক ভাষাবিজ্ঞান মূলত যারা ভাষাবিজ্ঞান(Linguistics), কম্পিউটার ভাষাবিজ্ঞান (Computational Linguistics), ক্রিমিনোলজি(Criminology), আইন(Law), Cognitive Science, Data Analysis, Psychology তে পড়েন, তাদেরকে নিতে উৎসাহিত করা হয়। ফরেনসিক ভাষাবিজ্ঞানের পথিকৃৎ রজার শ্যু Wheaton College থেকে BA করেছিলেন। UK, USA, Australia, France তে বেশ কিছু বিশ্ববিদ্যালয়ে MA প্রোগ্রাম রয়েছে। এছাড়াও এই বিষয়ের শিক্ষার্থীদের চাহিদা রয়েছে।

ফরেনসিক লিঙ্গুস্টিকস ও বাংলাদেশ

দুঃখের বিষয় বাংলাদেশের দুটি বিশ্ববিদ্যালয়ে (ঢাকা এবং চট্রগ্রাম) ভাষাবিজ্ঞান বিভাগ  থাকলেও এতে ফরেনসিক ভাষাবিজ্ঞানের উপর কোন কোর্স নেই। এমনকি Law এবং Criminology বিভাগের ছাত্ররাও এই বিষয়ে কোন কোর্স করে না। তবে বাংলাদেশের গোয়েন্দা তৎপরতায় এটির ব্যবহার হয়। বিদেশ হতে বা বিভিন্ন ট্রেনিং এর মাধ্যমে গোয়েন্দারা ফরেনসিক লিঙ্গুস্টিকস কে অপরাধ শনাক্তকরণে ব্যবহার করে। যেহেতু বাংলাদেশেও সাইবার ক্রাইম ক্রমশ বৃদ্ধি পাচ্ছে সুতরাং আশা করা যায় অদূর ভবিষ্যতে এই কোর্স বাংলাদেশের বিশ্ববিদ্যালয়গুলতেও অন্তর্ভুক্ত হবে।


Feature Image Source: lama.hypotheses.org

Reference:

1.Johnson,Alison and Coulthard,Malcolm,2007.An introduction to Forensic Linguistics:Language in Evidence

2.Olsso,John,2004.Forensic Linguistics

3.Wikipedia.org/wiki/Forensic_linguistics

4.wikipedia.org/wiki/roger_shuy

5.www.fbi.gov/history/famous-case/unabomber

6.YouTube channel:The virtual Linguistics campus .

7.YouTube Channel : Linguist Studnt