منتديات شو ون شو  

العودة   منتديات شو ون شو > الرحــــيــــق للكـمـبـيــوتـر و التـكـنـولـوجـيـــا > تطوير المواقع والمنتديات والاستايلات ولغات البرمجة وإشهار المواقع ومحركات البحث
التسجيل مشاركات اليوم البحث

إضافة رد
 
أدوات الموضوع إبحث في الموضوع انواع عرض الموضوع
قديم 14-03-2009, 04:15 PM رقم المشاركة : 1
معلومات العضو
إحصائية العضو








آخر مواضيعي


سلسبيل الخير غير متواجد حالياً


افتراضي عناكب محركات البحث و ملف Robots.txt




عناكب محركات البحث و ملف Robots.txt


مقدمة:
سنشرح فى هذا الدرس كل ما يتعلق بملف robots.txt هذا الملف الشهير الذى يتحدث الكثير عنه ونقوم بوضعه فى مواقعنا دون ان نفهم محتواه او الفائده منه , بعد هذا الدرس ستفهم كل شىء عنه وستكتب محتوياته بيدك دون الرجوع لأحد , فقط تابع الدرس بتركيز .

معنى كلمة robots :
المعنى الحرفى لكلمة robots هى " الرجل الالى" وهذا ادق معنى للrobots الخاصه بمحركات البحث ولكنها ايضا يطلق عليها فى بعض الاحيان Wanderers بمعنى "المتجولون" او spiders " بمعنى عناكب ....الان بدأنا نعرف عن ماذا اتحدث عندما ذكرت كلمة عناكب اليس كذلك؟
عناكب محركات البحث تقوم في العادة بالبحث عن ملف خاص في موقعك يدعى robots.txt و هو عبارة عن ملف نصي عادي بامتداد .txt يمكنك تحريره بأي محرر نصي مثل notepad .. و هذا الملف يمكننا تشبيهه بباب الموقع بالنسبة لعناكب محركات البحث spiders ..

تخيل أنه لديك معرض و سيأتيك الزوار. يمكنك ان تضع حارسا في الباب يسمح بدخول الجميع أو البعض و يقوم بتوجيههم لزيارة كامل المعرض أو غرفة معينة .. هذه نفس الحالة بالنسبة لملف robots.txt فهو يقوم بتوجيه عناكب البحث إلى أماكن معينة و يتحكم فيها و سنستعرض في هذا الموضوع هذه الأشياء.
حسنا نستخلص من هذا ان ال robots هى عناكب محركات البحث وبالتالى سيكون ملف robots.txt هو المسؤول عن توجيه هذه العناكب

ما هى العناكب وما هى وظيفتها:
عناكب محركات البحث عباره عن برامج تتصفح المواقع تلقائيا . محركات البحث مثل Google تستخدم العناكب فى أرشفة محتويات المواقع لكى تبنى بها محرك بحث Google الشهير .كما ان بعض ال spammers -وهم الذين يهتمون بجمع الايميلات ومراسلتها بغرض الدعايا- يقومون بعمل عناكب بهدف جمع الايميلات من المواقع

حتى الان عرفنا ماهى العناكب ووظيفتها وما هو ملف الـ robots.txt ووظيفته ولكن سنتعلم فى النقاط التاليه المزيد من وظائف ملف الـ robots.txt وكيفية كتابتة واعداده

بأختصار:
اى صاحب موقع يجب عليه ان يقوم بعمل ملف robots.txt لكى يقوم بتوجيه عناكب محركات البحث القادمة الى موقعة وهذا يسمى ببروتوكول استثناء العناكب The Robots Exclusion Protocol , وهذا مثال لكيفية عمل ملف robots.txt:

سنفترض ان احد عناكب محركات البحث جاء الى الصفحة التالية http://www.example.com/welcome.html قبل ان يقوم بالتعامل مع الصفحة يتحقق اولا من وجود هذا الملف http://www.example.com/robots.txt, وسنفترض مثلا انه وجد به الكود التالى
كود:
User-agent: *
Disallow: /
هذا الكود يعنى ان الموقع يوافق على دخول جميع عناكب محركات البحث
كود:
User-agent:  *
وهذا الكود يعنى انه غير مسموح لعناكب محركات البحث بزيارة اى صفحه بداخل هذا المجلد

لاحظ النقاط التالية:


  1. بعض العناكب تتجاهل ملف الـ robots.txt مثل العناكب التى تدخل الموقع لتبحث عن الثغرات الامنية والايميلات
  2. ملف الـ robots.txt متاح لأى زائر ويستطيع الكل قراءته لذلك لا تستخدمه لأخفاء معلومات لأنك فى هذه الحاله تفضح المعلومات ولا تخفيها

سننتقل الان الى الجزء الاهم فى هذا الشرح فرجاء التركيز
كيف يمكنك عمل ملف الـ robots.txt ؟
وهذا السؤال ينقسم الى عدة نقاط
اولا : اين يوضع ملف الـ robots.txt ؟
الاجابة المختصره على هذا السؤال:
يوضع فى مجلد الموقع الرئيسى , بمعنى ان رابط الملف بعد تركيبه سيكون بهذا الشكل http://www.example.com/robots.txt
الاجابة المفصله لهذا السؤال :
ان عناكب محركات البحث عندما تقوم بالتحقق من وجود ملف الـrobots.txt فهى تقوم بحذف جزء من الرابط هذا الجزء هو من اول slash "/"حتى نهاية الرابط وتضع مكان هذا الجزء "/robots.txt"

[right]مثال على ذلك بالنسبة لهذا الرابط http://www.example.com/shop/index.html ستقوم العناكب بحذف /shop/index.html وستضع مكانه "/robots.txt" اى انها ستبحث عن ملف ال robots.txt على هذا الرابط http://www.example.com/robots.txt
وتذكر دائما ان تكتب اسم الملف بالحروف الصغيره اى ان اسمه robots.txt ووليس Robots.TXT

ماذا سأضع بداخل ملف الـ robots.txt ؟

ملف الـ robots ملف نصى "text" وظيفته الاساسية هى الاستثناء كما سنرى
الامر ابسط مما تتخيلون
سنشرح عن طريق امثله لمحتويات ملف الـrobots.txt وتفسيرها
كود:
User-agent: *
Disallow: /cgi-bin/
Disallow:  /tmp/
بواسطتة هذا الكود قمنا بالسماح لجميع محركات البحث بزيارة الموقع عن طريق السطر الاول وقمنا بأستثناء هذه المجدلدت cgi-bin ,tmp من الارشفه اى منعنا عناكب محركات البحث من زيارت هذه المجلدات وكامل محتوياتها

لاحظ انك يجب ان تضع امر "Disallow" فى سطر منفصل كل مره تحجب فيها مجلد او رابط معين ولا يمكنك حجب مجلدين فى نفس الوقت عن طريق امر واحد بل ضع لكل مجلد امر "Disallow" بمفرده

كود:
User-agent: *
Disallow: /
بواسطة هذا الكود نمنع كل عناكب محركات البحث من ارشفة كل محتويات الموقع




كود:
User-agent: *
Disallow:
هذا الكود يسمح لجميع العناكب بالدخول وارشفة جميع محتويات الموقع ويمكنك الاستغناء عن هذا الكود برفع ملف robots.txt فارغ او عدم عمل الملف نهائيا

كود:
User-agent: *
Disallow: /cgi-bin/
Disallow:  /tmp/
Disallow: /junk/
بواسطة هذا الكود منعنا جميع العناكب من زيارة اقسام معينه من الموقع


كود:
User-agent: BadBot
Disallow:  /
يستخدم هذا الكود لمنع عناكب احد محركات البحث



كود:
User-agent:  Google
Disallow:

User-agent: *
Disallow: /
هذا الكود يستخدم للسماح لعناكب احد محركات البحث بالزيارة واستثناء الاخرون



كود:
User-agent: *
Disallow:  /~joe/junk.html
Disallow: /~joe/foo.html
Disallow:  /~joe/bar.html
وبالطبع هذا الكود لأستثناء الملفات كما هو ظاهر






كود:
User-agent: *
Disallow:
user-agent هو العميل أي عنكبوت محرك بحث معين .. إذا رغبت في السماح لجميع عناكب محركات البحث بالدخول إلى موقعك أكتب النجمة " * " اي جميع العناكب. Disallow: تستعمل لحجب مجلدات خاصة لا تريدها أن تظهر في نتائج البحث إذا تركتها فارغة فمعناه أنك لم تقم بمنع أي شيء و بالتالي كل شيء مسموح لأرشفته.

--------------------------------------------

كود:
User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow:  /sql/
هذا الكود للسماح لجميع عناكب البحث بالدخول إلى موقعي ما عدى مجلدات cgi-bin و tmp و sql.

-------------------------------------------

كود:
User-agent: XBot
Disallow: /
في هذه الحالة XBot اي عنكبوت محرك بحث " X" لا يمكنه مشاهدة اي شيء في الموقع. بوضعك لـ : / اختصار لجميع المجلدات.

-----------------------------------------

كود:
User-agent:  XBot
Disallow: /
 
User-agent:  *
Disallow: /private/
الفراغ الذي قمنا به بين user-agent الأولى و الثانية هو للإشارة إلى أنن سنضع أمرا جديد لعناكب البحث و بالتالي يمكنك حجب عنكبوت معين من مشاهدة موقعك في الأمر الأول و السماح لبقية عناكب محركات البحث * بأرشفة موقعك ما عدى ملف private.

--------------------

بعض الأخطاء الشائعة في ملف robots.txt :

كود:
User-agent: *  
Disallow  /

Disallow / ينقصها نقطتان " : "


كود:
User-agent: *  
Disallow: *
إذا أردت منع ارشفة كل شيء استعمل " / "

كود:
User-agent: *
Disallow:  /tmp/
 
User-agent: Xbot
Disallow: /links/listing.html
Disallow:  /tmp/

عناكب البحث تقرأ الملف من الاعلى الى الأسفل لذلك إذا منعت جميع العناكب في السطر الأول من زيارة ملف tmp فلا داعي لوضع الأمر التالي









التوقيع



اذا اعجبك موضوعى فلا تقل لى شكر وادعو لى بالاتى :
(ان يغفر لى ما تقدم وما تأخر من ذنبى وان يقينى
عذاب القبر وعذاب النار وان يدخلنى الفردوس
وان يجيب دعائى فى الدنيا والاخرة)ولكم مثله

فستان فرحى الابيض هو روب المناقشة الاسود

http://img340.imageshack.us/img340/8660/333i.gif اللهم لا تجعل فى قلبى حب الا لك ولا تعلق الا بك http://img340.imageshack.us/img340/8660/333i.gif


رد مع اقتباس
قديم 14-03-2009, 06:35 PM رقم المشاركة : 2
معلومات العضو
صاحب الموقع
إحصائية العضو








آخر مواضيعي


admin غير متواجد حالياً


افتراضي

موضوع مهم وكثيرا جدا ما ارى ان العناكب اكثر من الضيوف انفسهم
زانا اعتقد ان وجود عناكب جوجل تعتمد فى الاساس على خريطة المنتدى site map







التوقيع

الظاهر بيبرس

رد مع اقتباس
قديم 06-05-2009, 02:02 AM رقم المشاركة : 3
معلومات العضو
إحصائية العضو








آخر مواضيعي


سلسبيل الخير غير متواجد حالياً


افتراضي

السلام عليكم ورحمة الله وبركاته

اقتباس:
المشاركة الأصلية كتبت بواسطة الظاهر بيبرس مشاهدة المشاركة
موضوع مهم وكثيرا جدا ما ارى ان العناكب اكثر من الضيوف انفسهم
زانا اعتقد ان وجود عناكب جوجل تعتمد فى الاساس على خريطة المنتدى site map

نعم اخى والعناكب تلقائيا تبحث فى المنتديات

بارك الله فيك على مرورك الطيب

تحياتى وتقديرى






التوقيع



اذا اعجبك موضوعى فلا تقل لى شكر وادعو لى بالاتى :
(ان يغفر لى ما تقدم وما تأخر من ذنبى وان يقينى
عذاب القبر وعذاب النار وان يدخلنى الفردوس
وان يجيب دعائى فى الدنيا والاخرة)ولكم مثله

فستان فرحى الابيض هو روب المناقشة الاسود

http://img340.imageshack.us/img340/8660/333i.gif اللهم لا تجعل فى قلبى حب الا لك ولا تعلق الا بك http://img340.imageshack.us/img340/8660/333i.gif


رد مع اقتباس
إضافة رد


الذين يشاهدون محتوى الموضوع الآن : 1 ( الأعضاء 0 والزوار 1)
 

تعليمات المشاركة
لا تستطيع إضافة مواضيع جديدة
لا تستطيع الرد على المواضيع
لا تستطيع إرفاق ملفات
لا تستطيع تعديل مشاركاتك

BB code is متاحة
كود [IMG] متاحة
كود HTML معطلة


المواضيع المتشابهه
الموضوع كاتب الموضوع المنتدى مشاركات آخر مشاركة
من هم اهل البيت الكاظمي عقيدة أهل السنة والجماعة 16 28-11-2010 04:39 PM
موقعك الاول وتجلب محركات البحث والزوار اتبع الخطوات هذه سلسبيل الخير تطوير المواقع والمنتديات والاستايلات ولغات البرمجة وإشهار المواقع ومحركات البحث 1 07-11-2010 06:07 PM
آل البيت النهر الأزرق الصوتيات والمرئيات والاسطوانات الإسلامية والأناشيد بدون موسيقى 2 30-10-2010 11:16 AM
الآن ضيف موقعك بقوقل ومع كثير من محركات البحث العالمية ! admin تطوير المواقع والمنتديات والاستايلات ولغات البرمجة وإشهار المواقع ومحركات البحث 0 10-11-2009 03:56 PM
برنامج لنشر موقعك على كل محركات البحث admin تطوير المواقع والمنتديات والاستايلات ولغات البرمجة وإشهار المواقع ومحركات البحث 0 27-10-2009 06:53 PM


Loading...

الاتصال بنا - منتديات شو ون شو - الأرشيف - الأعلى

Powered by vBulletin® Version 3.8.4
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
3y vBSmart
لا يسمح بوضع موضوعات تخالف منهج أهل السنة والجماعة