فایل Robots.txt در سئو! راهنمای کاربردی برای مبتدیان SEO

نویسنده: تحریریه آرسافت

فایل robots.txt یکی از راه‌های اصلی مدیریت نحوه بازدید ربات های موتور جستجو از وب‌سایت شما است. در این فایل شما به ربات گوگل می گویید که چه صفحه ای را می تواند ببیند و چه صفحه ای را نه. همه موتورهای جستجوی اصلی از عملکرد اصلی آن پشتیبانی می کنند، اما برخی به قوانین اضافی نیز احترام می گذارند که می تواند مفید باشد.

ما در این راهنمای سئو، هر آنچه که در مورد فایل robots.txt به آن نیاز داشته باشید به شما توضیح داده ایم. از جمله این که فایل robots.txt چیست، چه کاربردی در سئو دارد و چطور می توان یک نمونه از آن را برای سایت ایجاد کرد. 

بیایید با هم به سراغ این فایل مهم برویم.

فایل Robots.txt چیست؟

Robots.txt فایلی است که به خزنده‌های موتورهای جستجو راهنمایی می‌کند که به چه آدرس‌هایی از وب‌سایت شما می تواند دسترسی داشته باشند. این در درجه اول برای مدیریت ترافیک خزنده و جلوگیری از بارگیری بیش از حد سایت شما با درخواست ها استفاده می شود.

robots.txt باید در ریشه وب سایت قرار بگیرد تا خزنده آن را پیدا کنند. در حالی که موتورهای جستجوی اصلی مانند گوگل، بینگ و یاهو دستورالعمل‌های robots.txt را می‌شناسند و به آن احترام می‌گذارند، توجه به این نکته مهم است که این فایل روشی بی‌خطر برای جلوگیری از نمایش صفحات وب در نتایج جستجو نیست.

در عین حال که فایل robots.txt برای خیلی ها ناشناخته است اما در سئو چندان بی اهمیت نیست. در ادامه توضیحاتی در این خصوص ارائه شده است. 

اهمیت فایل robots.txt در سئو

چرا Robots.txt در سئو مهم است؟

اکثر وب سایت ها به فایل robots.txt نیاز ندارند. به این دلیل که گوگل معمولاً می تواند تمام صفحات مهم سایت شما را پیدا کرده و فهرست بندی کند. آنها به طور خودکار صفحاتی را که نسخه های مهم یا تکراری صفحات دیگر نیستند ایندکس نمی کنند.

با این حال، ۳ دلیل اصلی وجود دارد که می‌خواهید از فایل robots.txt استفاده کنید.

- مسدود کردن صفحات غیر عمومی: گاهی اوقات، صفحاتی در سایت خود دارید که نمی خواهید ایندکس شوند. برای مثال، ممکن است یک نسخه مرحله‌بندی از یک صفحه، یک صفحه ورود به سیستم یا یک صفحه نتایج جستجوی داخلی داشته باشید. این صفحات باید وجود داشته باشند، اما شما نمی خواهید افراد تصادفی روی آن ها بیایند. در این مورد، از robots.txt برای مسدود کردن این صفحات از خزنده‌ها و ربات‌های موتور جستجو استفاده می‌کنید.

- به حداکثر رساندن بودجه خزیدن: اگر در فهرست کردن همه صفحات خود با مشکل مواجه هستید، ممکن است مشکل بودجه خزیدن داشته باشید. با مسدود کردن صفحات بی‌اهمیت با robots.txt ربات گوگل (Googlebot) می‌تواند بیشتر از بودجه خزیدن شما را صرف صفحاتی کند که واقعاً مهم هستند.

- جلوگیری از نمایه سازی منابع در موتورهای جستجو: استفاده از دستورات متا می تواند به همان اندازه Robots.txt برای جلوگیری از ایندکس شدن صفحات کار کند. با این حال، دستورالعمل‌های متا برای منابع چندرسانه‌ای، مانند فایل‌های PDF و تصاویر، به خوبی کار نمی‌کنند. اینجاست که robots.txt وارد عمل می شود.

نتیجه نهایی؟ Robots.txt به خزنده های موتورهای جستجو می گوید که صفحات خاصی را در وب سایت شما نخزند. می توانید بررسی کنید که چند صفحه را در کنسول جستجوی گوگل ایندکس کرده اید.

اگر آمار کنسول با تعداد صفحاتی که می‌خواهید ایندکس شوند مطابقت دارد، نیازی به زحمت ساخت فایل Robots.txt ندارید. اما اگر این عدد بیشتر از چیزی است که انتظار داشتید (و متوجه URL های ایندکس شده ای شده اید که نباید ایندکس شوند)، زمان آن رسیده است که یک فایل robots.txt برای وب سایت خود ایجاد کنید.

فایل robots.txt

چگونه فایل robots.txt خود را پیدا کنیم؟

گفتیم که فایل robots.txt باید در ریشه وب سایت قرار بگیرد، یعنی دقیقا در کف پوشه public_html.

برای اطمینان از وجود این فایل می توانید آدرس آن را به این صورت domain.com/robots.txt در مرورگر وارد کنید تا محتویات فایل برای شما نمایش داده شود. 

اگر چنین فایلی در سایت وجود ندارد باید خودتان آن را بسازید. ساده ترین روش برای ساخت فایل robots.txt استفاده از برنامه notepad ویندوز است. 

نتیجه گیری

Robots.txt یک فایل ساده اما قدرتمند است. اگر از آن عاقلانه استفاده کنید می تواند تأثیر مثبتی بر سئو داشته باشد. اگر هم با بی دقتی از آن استفاده کنید، پشیمان خواهید شد. اگر هم سایت شما کوچک است و کلا مشکلی با خزش و ایندکس صفحات سایت خود ندارید کلا بی خیال این فایل شوید.

منبع: backlinko

دیدگاه خود را بنویسید

اگر نظری در مورد این صفحه یا هر بخشی از آرسافت دارید آن را از طریق بخش زیر در قالب دیدگاه برای ما ارسال کنید.