loading...
اسکریپ سایت|پلاگین چت روم
HAMED بازدید : 73 چهارشنبه 12 آذر 1393 نظرات (0)

  robots.txt

این فایل چه کار می کنه؟
ربات های جستجوگر را هشیار می کنه که برای جستجو چه فایل هایی را نباید باز کنند و چه فایل هایی رو می تونند باز کنند
خاصیتش چیه
برای کاربر مهمترین خاصیتش حفظ امنیته و حفظ حریم های شخصی به این وسیله کاربر می تونه مدارک خصوصی و عکس های خانوادگیش رو با آرامش روی هاستش نگه داری کنه
برای ربات ها هم خاصیتش اتلاف کمتر وقت و انرژی در یک سایته و این امر دومین خاصیت فایل رو ایجاد می کنه
موتورها رو تشویق می کنه به یافتن نتایج جستجو ها در سایت هایی که robots.txt دارند و این یعنی بالا رفتن در رتبه ی گوگل و آلکسا
این فایل باید در یک صفحه text only به وسیله ی notepad نوشته بشه و کد و علائم جدا کننده خاص مثل <> یا , و " نیاز نداره ولی هر تکه از دستوراتش باید در یک سطر جدا باشه
این فایل بر پایه دو دستور Disallow و Allow و یک شاخصه User-agent نوشته می شه
Disallow محدوده ممنوع رو تعریف می کنه
Allow محدوده ی آزاد برای جستجو
User-agent محدوده کسانی که اجازه جستجو براشون مسدود یا باز شده
سایت گوگل سالم ترین نمونه ی این برگه رو نمایش داده
نگاه کنید:
http://www.google.com/robots.txt
و به این ترتیب کد زیر

کد PHP:
User-agent: *
Disallow: /news
Allow
: /news/directory 

در این فایل اینگونه ترجمه می شه
هر نوع جستجوگر و رباتی (هیچ نوع)
نمی تونه پوشه news را جستجو کنه ولی می تونه زیر پوشه ی directory رو از این پوشه بخونه و جستجو کنه
گوگل دستورات این فایل را به اینگونه تقسیم می کنه
برای بلوکه کردن جستجو در کل سایت

کد PHP:
Disallow: / 

برای مسدود کردن جستجوی یک پوشه

کد PHP:
Disallow: /junk-directory

برای مسدود کردن جستجو در یک صفحه

کد PHP:
Disallow: /private_file.html 

برای اینکه یک عکس در لیست یافته های گوگل دیده نشود

کد PHP:
User-agentGooglebot-Image
Disallow
: /images/dogs.jpg 

برای پاک کردن کل عکس های سایت از لیست جستجوی گوگل

کد PHP:
User-agentGooglebot-Image
Disallow
: / 


برای پاک کردن یک فرمت مشخص (مانند gif) از جستجوی گوگل

کد PHP:
User-agentGooglebot
Disallow
/*.gif$ 

برای صفحاتی که هنوز مطالبشون در حال تکمیله و یا آماده پذیرش آگهی نیست مطالب این صفحات در نتایج جستجو دیده نمی شه ولی گوگل اونها رو آنالیز می کنه و دسته بندی های لازم رو روشون انجام می ده

کد PHP:
User-agent: *
Disallow: /
User-agentMediapartners-Google
Allow
: / 

خوب اینها تمام دانش مورد نیاز برای نوشتن این فایل بودند حالا برای شروع فولدرها و فایل هاتون رو روی هاست دسته بندی و لیست کنید و تلاش کنید هر گزینه را در یکی از شرایطی که بالا عنوان شد قرار دهید و یا برای دسته ی اخر که دسته ای کاملا مجاز خواهد بود جدا کنید
لیست نهایی شما به راحتی وضعیت هر فایل را مشخص می کنه
معمولا ما با کل ربات ها کار داریم و
user-agent :*
کارمون رو راه می ندازه که استفاده یکبار ازش در اولین سطر کافیه ولی اگر موردی مثل آخرین مورد ذکر شده بود

کد PHP:
User-agentMediapartners-Google 

نام ربات گوگل آنالیزه
نام بعضی از معروف ترین ربات ها هم عبارته از:

کد PHP:
User-agentIsraBot
# unless they're feeding search engines.
User-agentUbiCrawler
User
-agentDOC
User
-agentWebCopier
User
-agentOffline Explorer
User
-agentTeleport
User
-agentTeleportPro
User
-agentWebZIP
User
-agentlinko
User
-agentHTTrack
User
-agentMicrosoft.URL.Control
User
-agentDownload Ninja
User
-agentwget
# http://www.nameprotect.com/botinfo.html
User-agentNPBot
# http://www.webreaper.net/
User-agentWebReaper
User
-agentia_archiver 

در آخرین خطوط این فایل آدرس های sitemap.xml را اضافه می کنید به این صورت

کد PHP:
Sitemaphttp://YourDomain.com/sitemap.xml 


خب این فایلارو از هیچ سایتی کپی نکنید و فایل روبوتس بسازید!
نتیجش جز ضرر چیزی نداره!

ارسال نظر برای این مطلب

کد امنیتی رفرش
درباره ما
یه سایت جامع در مورد پلاگین ها و اسکیریپ و قالب ها افزودنیاهای چت روم و سایت
اطلاعات کاربری
  • فراموشی رمز عبور؟
  • نویسندگان
    آرشیو
    آمار سایت
  • کل مطالب : 214
  • کل نظرات : 24
  • افراد آنلاین : 1
  • تعداد اعضا : 18
  • آی پی امروز : 53
  • آی پی دیروز : 11
  • بازدید امروز : 1,823
  • باردید دیروز : 14
  • گوگل امروز : 1
  • گوگل دیروز : 3
  • بازدید هفته : 1,909
  • بازدید ماه : 2,483
  • بازدید سال : 6,646
  • بازدید کلی : 102,660