25 نکته کلیدی جستجوی کلمات فارسی در اینترنت
25 نکته کلیدی جستجوی کلمات فارسی در اینترنت
روشهای معمول جستجو با موتورهای جستجوگر
جستجوی اطلاعات در اینترنت به دو روش میتواند صورت گیرد یکی استفاده از جملات زبان محاورهای است و دیگری بکارگیری کلمات کلیدی.
استفاده از جملات زبان محاورهای
در روش استفاده از جملات زبان محاورهای که اغلب به کاربران تازهکار پیشنهاد میشود. یکی از عیبهای بزرگ این روش تعداد نتایج جستجوی زیادی است که بازگردانده میشود. به همین دلیل این روش توسط کاربران حرفهای و حتی توسط همه، کمتر استفاده میشود.
بکارگیری کلمات کلیدی
یکی از کاراترین و مقتدرترین روشهای جستجوی اطلاعات در دنیای وب استفاده از واژههایی است که اصطلاحاً کلمات کلیدی نامیده میشوند. اغلب کاربران حرفهای و جستجوگران ورزیده دنیای اینترنت میتوانند با طرح بهترین کلمات کلیدی و بکار بستن قوانین ترکیب آنها با هم برای نیازهای اطلاعاتی خود پاسخی در خور بیابند. در این روش توصیههای زیر برای انتخاب کلمات کلیدی و نیز جستجوی دقیق و مفید پیشنهاد میشود که بشرح ذیل است:
توصیه هایی برای جستجو بهتر در موتورهای جستجو
١- حتیالمقدور سعی شود کلمات کلیدی از میان اصطلاحات منحصر به فرد و اسامی خاص انتخاب شود.
٢- حتیالمقدور از آوردن کلمات عمومی که عناوین بسیاری را در زیر مجموعه خود شامل میشوند، جداً خودداری کنید.
٣ – همیشه اسم شخص یا نام شی یا هر چیز دیگری را که مد نظر دارید بهطور کامل وارد کنید.
٤ – دقت کنید که اگر موتور جستجو میان حروف بزرگ و کوچک تفاوتی میگذارد، این مسأله را در طرح کلمات کلیدی خود مدنظر داشته باشید.
٥ – در نظر داشته باشید اگر نتیجه جستجو صفر بود به احتمال زیاد میتواند از یک اشتباه تایپی باشد.
٦ – اگر املای صحیح و کامل کلمهای را نمیدانید از کارکتر جانشین که اغلب * و یا ؟ است استفاده کنید.
٧ – اگر یک کلمه کلیدی را برای طرح دقیق و تمام و کمال یک مورد جستجو کفایت نمیکند، از تکنیکهای جستجوی عبارتی، استفاده از اپراتورهای جبر بولین (AND, OR, NOT) استفاده کنید. جستجوی عبارتی یکی از مهمترین و قدرتمندترین امکانات جستجو در اغلب موتورهای جستجو میباشد و میتوان یک عبارت یا جمله مشخص را به همان ترتیبی که کلمات وارد شدهاند مورد جستجو قرار داد. برای این روش جستجو عبارت مورد نظر را داخل گیومه"" بگذارید.
٨ - استفاده از عملگر AND : and به مفهوم "و" برای محدود کردن دامنه جستجو از طریق ترکیب کلید واژههای مختلف به کار میرود و برای ترکیب کلیدهای جستجو زمانی که برای شما مهم است که دو یا چند کلمه کلیدی حتماً وجود داشته باشد و علامت آن در پایگاههای مختلف به صورت استفاده از عبارت and، استفاده از + ، انتخاب عبارت all the word از منو، انتخاب عبارت (match on all words and) بهوسیله کلیک کردن بر روی دکمههای رادیویی است.
٩– استفاده از عملگر OR: اپراتور OR به مفهوم "یا" و برخلاف عملگر AND باعث گسترش دامنه جستجو و بازیابی اطلاعات بیشتر شده برای ترکیب کلید واژههای جستجو زمانی که انتظار دارید تنها یک، دو یا چند کلمه کلیدی حضور داشته باشند و علامت آن استفاده از عبارت or، نحوهی اجرای ساده و معمولی آن، انتخاب عبارت any of the words از منو، انتخاب عبارت (match on any words or) با کلیک بر روی دکمههای رادیویی میباشد. یکی از کاربردهای مهم این عملگر پوشش مفاهیم یا اصطلاحات مترادف، مرتبط یا با املاهای متفاوت است.
١٠ – استفاده از عملگر NOT: اپراتور Not به مفهوم "نه" و یا به جز که در این صورت تمامی جوابهای بازگشتی که حاوی عبارت یا کلمه کلیدی هستند حذف خواهند گردید و برای اجرای آن تنها کافیست که not را قبل از عبارت یا کلمه کلیدی مورد نظرتان با یک فاصله بیاورید.
١١ – استفاده از کوتاهسازی کلید واژهها: این تکنیک به ما امکان میدهد که با وارد کردن بخشی از یک کلید واژه بتوانیم مشتقات مختلف آن را نیز در فرآیند جستجو بازیابی کنیم. اکثر موتورهای جستجو این تکنیک را با استفاده از علامت ستاره (*) ارایه میدهند. یکی از مشکلات استفاده از این تکنیک این است که باعث بازیابی اطلاعات غیرمرتبط و ناخواسته زیادی میشود.
١٢ – استفاده از عملگر نزدیکیابی: در بسیاری از موارد استفاده از عملگر and باعث بازیابی اطلاعاتی میشود که برای ما مفید نیست. به این دلیل که این عملگر کلید واژهها را در هر کجای متن که باشند بازیابی میکند. در این موارد استفاده از تکنیک نزدیکیابی میتواند از ریزش کاذب اطلاعات و یا بازیابی اطلاعات غیرمرتبط جلوگیری نماید. همه موتورهای جستجو قابلیت استفاده از این تکنیک را ندارند ولی به عنوان مثال در موتور جستجوی آلتاویستا میتوان با استفاده از عملگر NEAR از این تکنیک استفاده نمود.
١2+1 – جستجوی ترکیبی با استفاده از پرانتز: این تکنیک یکی از مهمترین تکنیکهای جستجو میباشد که به وسیله آن میتوان تا حدود زیادی از بازیابی موارد غیرمرتبط در محیط وب جلوگیری کرد. در این روش میتوان از همه عملگرهای جستجو که در بالا گفته شده یکجا استفاده کرد و آنها را با همدیگر ترکیب نمود.
١٤ – جستجوی کلیدواژه در عنوان صفحات وب: این تکنیک با این پیش فرض که عنوان یک صفحه وب تا حدود زیادی نمایانگر محتوای اطلاعات موجود در آن است به جستجوی واژههای کلیدی در عنوان سایتها میپردازد. علامت آن در موتورهای جستجو متفاوت است ولی اغلب موتورهای جستجو از طریق فهرست انتخابی و یا گزینههای دیگر این امکان را فراهم میآورند.
١٥ – جستجوی حوزه سایتها: با توجه به این که به صورت قراردادی هر کشوری حوزه خاصی در محیط وب دارد، قابلیت جستجوی حوزه سایتها به ما این امکان را میدهد که فرایند جستجو را به حوزه خاصی نظیر سایتهای وب ایران (ir) و یا سایتهای وب سازمانهای غیر انتفاعی (org) محدود کنیم. دستورات استفاده از این تکنیک در موتورهای جستجو مختلف میباشد.
١٦ – محدود کردن جستجو به زبانهای مختلف باعث میشود نتایج جستجو به زبانهای دیگر آورده نشود و انتخاب مطلب مورد نظر آسانتر است.
١٧ – محدود کردن جستجو به تاریخ انتشار منابع در وب: تاریخ انتشار یا به اصطلاح روزآمدی مطلب به خصوص در منابع علمی اصل مهمی است و اینگونه محدودیت باعث میشود بنا به نیاز کاربر جدیدترین و یا قدیمیترین منبع بازیابی بشود.
١٨ – جستجوی رسانههای مختلف؛ موسیقی، عکس، ویدئو: زمانی که فقط نوع خاصی از رسانه مورد نیاز است به عنوان مثال زمانی که به عکس یک شخصیت نیاز داریم، جستجو در میان عکسها باعث میشود نتیجه جستجو شامل اطلاعات دیگری در مورد آن شخصیت نباشد.
١٩ – جستجوی صفحات با فرمتهای مختلف: PDF, Word, MP3, MPEG, ….: زمانی که فرمت خاصی مورد نظر است میتوان از این تکنیک استفاده کرد . به عنوان مثال اگر مایل باشیم منبع بازیابی شده در فرمت PDF باشد، این تکنیک میتواند مفید باشد.
٢٠ – آگاهی از پیشفرضهای جستجو در موتور جستجو: با توجه به این که هر موتور جستجو برای ترکیب واژهها یک پیشفرض دارد و اگر از هیچ گونه عملگری استفاده نشود، کلید واژهها را به صورت پیشفرض با یکی از عملگرهای جبر بولی ترکیب میکند؛ آگاهی از این پیشفرض موتورهای جستجوی مختلف مهارت ما را در جستجو بالا میبرد.
٢١ – وب نامریی: وب نامرئی به دو دلیل کمی و کیفی اهمیت دارد کمی از این نظر که موتورهای جستجو فقط قادر هستند حدود ١٦ درصد از اطلاعات موجود در اینترنت را بازیابی کنند و اندازه وب نامریی تقریبا ٥٠٠ برابر وب مریی است و کیفی از این نظر که منابع اطلاعاتی موجود در وب عمیق معمولا ارزشمند و مفید هستند و در بسیاری از موارد پاسخگوی نیاز کاربران میباشند. آشنایی با ابزارهایی که برای شناسایی منابع وب نامریی به وجود آمدهاند و کاربران را به سایتهای مناسب راهنمایی میکنند، باعث دسترسی به این بخش عظیم از اطلاعات مفید و ارزشمند میشود. مثل سایت Invisibleweb که فهرستی از منابع نامریی را و سایت Completeplaset که فهرستی از تقریبا ٤٠٠٠٠ پایگاه اطلاعاتی وب نامریی را ارایه میدهد.
22 – اما بدنیست که اشتباهات رایج و متدوال در جستجوگرها و موتورهای جستجو را بدانیم تا از آن گریز کنیم
اشتباهات متداول موتورهای جستجو در یافتن کلمات
موتورهای جستجو به عنوان یکی از اساسیترین دروازههای ورود به منابع اینترنتی دارای ضعفهایی هستند که میتوان به این موارد اشاره کرد:
- در یک مجموعه از یافتههای بازیابی شده مدخلهای تکراری فراوانی ملاحظه میشود.
- نتایج غیر قابل پیشبینی هستند.
- نتایج چه بسا گمراه کننده باشند؛ ممکن است جستجویی در یک موتور کاوش نتیجهای نداشته، ولی در موتور دیگر دارای یافتههای فراوان باشد.
- موتورهای کاوش محتویات پایگاههای اطلاعاتی خودشان را نشان نمیدهند و از معیارهایی که برای گنجاندن یک مدرک در فایلهایشان دارند حتی شرحی ارایه نمیکنند.
- مهار واژگانی وجود ندارد و قواعد نقطهگذاری و بزرگنویسی نیز استاندارد نیست.
- بدون بررسی عملی هر عنصر، اغلب نمیتوان میزان ربط و رابطهها را تحلیل کرد. یعنی اطلاعات کافی در مدخل نمایه نیست تا فرد بتواند دست به انتخاب بزند.
- عدم توان موتورهای جستجو در تمایز میان مدارکی که توسط فرد الف نوشته شده و مدارکی که درباره فرد الف نوشته شده است.
- منابع قابل توجهی در شبکه وب وجود دارند که توسط موتورهای جستجو نمایه نمیشوند. به این بخش از وب اصطلاحاً وب نامریی میگویند. «وب نامریی بخش بزرگی از وب است که موتورهای جستجو آنها را نمیتوانند نمایه کنند و عبارتند از: سایتهای دارای رمز عبور، فایلهای پی.دی.اف از متون آرشیو شده، ابزارهای تعاملی نظیر ماشین حسابها و برخی از واژهنامهها و همچنین بعضی از پایگاههای اطلاعاتی، منابع محافظت شده از طریق اسم کاربر و گذر واژه، منابع و صفحات وب بدون پیوند و صفحات افزون بر حداکثر تعداد صفحات قابل مرور.»
23- مشکلات خاص فارسی زبانان و ایرانیان در دنیای اینترنت
نبود استاندارد ثابت رسمالخط فارسی موجب این شده است که به تعداد صفحات وب فارسی سبک و سیاق نگارش به کار رفته باشد، لذا میتوان چنین ارزیابی کرد که اکثر وبهای فارسی در برخی خصوصیات مشترک میباشند از جمله این که نگارش برخی از آنها زبان غیررسمی و محاورهای است و به خصوص در متون علمی اغلب واژههای بیگانه به دفعات استفاده میشود. رسمالخط مورد استفاده نیز متفاوت و سلیقهای است و برخی از آنها غلطهای تایپی و نگارشی فراوانی دارند و این خصوصیات، اغلب به جهت محدودیتهای محیط الکترونیکی و عدم تطابق رسمالخط فارسی با آن میباشد که نمایهسازی و سپس جستجو به این زبان را با دشواریهایی رو به رو میسازد.
24- مشکل عدم اندیکس و نمایه جستجوهای به زبان فارسی
هرچند در حال حاضر راهنمایهایی برای منابع اینترنتی تهیه شده است که براساس فایلهای مقلوب ساخته شدهِ توسط موتورهای جستجو و با استفاده از قابلیتهای مختلف این موتورها از جمله؛ استفاده از عملگرهای بولی، جستجوی دقیق عبارت، محدود کردن یک جستجو به بخش خاصی از رکورد (مانند عنوان، آدرس) کوتاهسازی کلمات، جستجوی نزدیکیابی واژهها، ایجاد محدودیت زمانی و منطقهای و زبانی و .... به جستجوی اطلاعات کمک میکند اما باید تاکید کرد که در امر بازیابی اطلاعات از اینترنت بدون نمایهسازی نظام یافته نمیتوان انتظار بازیابی مفید و مؤثر را داشت. هرچند بیشترین اطلاعات موجود بر روی اینترنت به زبان انگلیسی است، ولی حجم اطلاعات به زبان فارسی نیز با سرعت در حال افزایش است و کاربران به دلایل مختلفی علاقه زیادی به اطلاعات فارسی نشان میدهند و از آن جایی که زبان غالب در اینترنت انگلیسی است، جستجو به زبانهای غیرانگلیسی از جمله فارسی، مسایل و مشکلات مختلفی را جدای از مشکلات عمومی اینترنت دارد.
25- سخن آخر به همه اهالی دنیای مجازی به فارسی بیاندیشیم
اینترنت به عنوان یک محمل اطلاعاتی عظیم، منابع اطلاعاتی را در مقیاسی وسیع در دسترس مخاطبان بالقوه قرار داده است. سهولت دسترسی به منابع اطلاعاتی اعم از متن و سایر رسانهها عمدهترین مزیت اینترنت محسوب میشود. این توانایی که هر کس ناشر آثار خود باشد عواقب ناخواستهای را نیز در پی خواهد داشت و آشکارترین معضل، آن است که انبوهی از منابع بسیار متنوع و غیرقابل مدیریت را فراهم میآورد. افزایش سریع منابع اینترنتی نیازمند یک سازماندهی مفید و مؤثر است
با پست های زیر بروزیم...
+ تقابل رهبری و روحانی به سبک آرمان هاشمی!
+ آرمیتا به آرزویش رسید!
+ عاقبت مذاکرات!!!
+ غواصانی که با شهادت از تفحص برگشتند!
+ من یمنی ام ...
+ نقش سران فتنه در حادثه ورزشگاه تبریز!!!
+ دانلود نماهنگ جدید "بازی ادامه دارد..." از حامد زمانی
در "دریچه انتظار" منتظر حضور پرمهرتان هستیم؛
darichehentezar.blog.ir
التماس دعای فرج + بصیرت + اخلاص + شهادت