فایل robots.txt چیست؟
فایل robots.txt یک فایل متنی است که بهوسیله آن خطمشی برای ربات موتورهای جستجو تعیین میکنیم که چه آدرسهایی را خزش و ایندکس کنند و چه آدرسهایی را خزش و ایندکس نکنند. موتورهای جستجو با خزیدن در میان صفحات سایت شما، آنها را ایندکس میکند و با دنبال کردن لینکها وارد صفحات یا سایتهای دیگر میشوند. هر ربات استانداردی قبل از خزیدن صفحهای از یک دامنه، ابتدا فایل robots.txt را میخواند و بر اساس دستورات موجود در این فایل، اجازه خزیدن را پیدا میکند تا بتواند ایندکس را انجام دهد. پس باید دقت داشته باشید که چه صفحاتی را برای خزیدن منع میکنید چراکه اگر بهاشتباه صفحات مهم خود را مخصوصاً صفحات فرود یا همان لندینگ پیج را از طریق این فایل برای رباتها مسدود کنید ضربه بدی به سئو سایت و در نتیجه تجارت آنلاین خود وارد میکنید. [av_notification title='جالب است بدانید' color='custom' border='' custom_bg='#55007c' custom_font='#ffffff' size='normal' icon_select='yes' icon='ue8a7' font='entypo-fontello' admin_preview_bg='' av_uid='av-1bs1t9f'] فایل robots.txt نیز برای رباتها نوشته میشود ولی جالب آن است که بدانید چنین فایلی برای انسانها هم داریم، فایلی با نام humans.txt که ماهیت آنیک پیام برای کاربران و بازدیدکنندگان سایت شما است که اصولاً به زبان انگلیسی نوشته میشود. [/av_notification] نمونه فایل robots.txt و فایل humans.txt برای سایت گوگل:https://s3.eu-1.blufs.ir/aradbranding-fa-uploads/topics/a3dbfbce574741f62803e9b894e34155a9045e13.txt https://s3.eu-1.blufs.ir/aradbranding-fa-uploads/topics/f8067b0c6c2fb3b1d90b0984a74134f10ce315d1.txt
فایل robots.txt را چگونه بسازیم و در کجا قرار دهیم؟
در قسمت زیر یک فایل دانلود قرار دادیم که نمونه آماده فایل robots.txt را آماده کردیم و می توانید دانلود کنید و همچنین فیلم آموزشی آن را نیز برایتان قرار دادیم که بعد از ساخت فایل robots.txt با فرمت ASCII یا UTF-8 باید این فایل حتماً در آدرس http://domain.com/robots.txt مورد دسترسی رباتها قرار گیرد. به جای عبارت http://domain.com باید اسم سایت خودتان را جایگزین کنید. [av_button label='دانلود فایل آماده robots.txt' link='manually,https://s3.eu-1.blufs.ir/aradbranding-fa-wp-content/uploads/2018/08/robots.txt' link_target='_blank' size='medium' position='center' icon_select='yes' icon='ue82d' font='entypo-fontello' color='theme-color' custom_bg='#444444' custom_font='#ffffff' admin_preview_bg='' av_uid='av-v3oaub']نمونه دستورات در فایل robots.txt
Disallow: مقابل این کیبورد دایرکتوری را درج میکنید که قصد ندارید ربات آن را ایندکس کند. بعد از عبارت User-agent میتوانید در هرچند بار که لازم باشد از Disallow استفاده نمایید. به این نکته مهم توجه کنید که ربات موتورهای جستجو به حروف کوچک و بزرگ در دایرکتوریها حساس هستند. Allow : برعکس دستور Disallow است هرچند دستور Allow غیر رسمی است ولی توسط اکثر رباتهای معروف شناخته شده است.آشنایی با نمونه دستورات در فایل robots.txt
مثال زیر در خط اول شامل همه ربات موتورهای جستجو میشود چراکه با علامت ستاره درجشده است و خط دوم با / درج شده و شامل کل آدرسهای یک دامنه میشود، بنابراین دستور زیر به این معنی است که هیچیک از موتورهای جستجو مجاز به خزیدن سایت شما نباشند.دستور زیر برعکس دستور بالا میگویید همه رباتهای موتورهای جستجو به کلیه آدرسهای سایت دسترسی دارند.User-agent: * Disallow: /
دستور زیر که در بسیاری از سایتهای وردپرس استفاده میشود به این معناست که تمام رباتها به پوشه ادمین wp-admin دسترسی نداشته باشند ولی به فایل admin-ajax.php که در این پوشه هست دسترسی پیدا کنند. البته بودن چنین دستوراتی در فایل robots.txt ضرری هم ندارد هر چند ربات توانایی وارد شدن به محیط ادمین وردپرس را ندارد ولی خطا در کدنویسی هم از سمت گوگل و هم از سمت ما طبیعتا امکانپذیر است. اگر توجه کرده باشید ما در این مقال یک بار از کیورد User-agent استفاده کردیم و سپس ۲ خط دستور وارد کردیم، شما میتوانید به تعداد دلخواه دستورات لازم را در هر خط وارد نمایید.User-agent: * Disallow:
User-agent: * Disallow: /wp-admin/ Allow: /wp-admin/admin-ajax.php