Thứ Hai, 29 tháng 7, 2019

Google cung cấp lời khuyên về mã trạng thái 404 và 410

Thỉnh thoảng câu hỏi về cách Google xử lý mã lỗi 404 và 410 xuất hiện. Vì vậy, thật tốt khi hiểu sự khác biệt. John Mueller của Google đã trả lời một câu hỏi thú vị về các trang web không còn tồn tại và nhà xuất bản web nên xử lý nó như thế nào.

Cách Google xử lý 404/410 Mã trạng thái

Trong Hangout Webmaster gần đây, John Mueller của Google đã nhận được câu hỏi sau:
Nếu một lỗi 404 xảy ra với một trang không tồn tại, tôi có nên biến chúng thành 410 không?
John Mueller đã trả lời:
Theo quan điểm của chúng tôi, trong trung hạn / dài hạn, 404 tương đương với 410 đối với chúng tôi. Vì vậy, trong cả hai trường hợp này, chúng tôi bỏ các URL đó khỏi chỉ mục của chúng tôi.
Chúng tôi thường giảm thu thập dữ liệu một chút trong số các URL đó để chúng tôi không mất quá nhiều thời gian để thu thập dữ liệu những thứ mà chúng tôi biết là không tồn tại.
Sự khác biệt tinh tế ở đây là một chiếc 410 đôi khi sẽ rơi ra nhanh hơn một chút so với 404. Nhưng thông thường, chúng ta đang nói theo thứ tự của một vài ngày hoặc lâu hơn.
Vì vậy, nếu bạn chỉ xóa nội dung một cách tự nhiên, thì việc sử dụng một trong hai nội dung đó là hoàn toàn tốt. Nếu bạn đã xóa nội dung này từ lâu, thì nó đã không được lập chỉ mục nên chúng tôi không sử dụng 404 hoặc 410.
Đó là một câu trả lời rất hữu ích về cách Google xử lý mã trạng thái 404 và 410. Điều đặc biệt quan tâm là bằng cách sử dụng mã trạng thái 410, bạn thực sự có thể tăng tốc quá trình Google xóa trang web khỏi chỉ mục của nó.
Tăng tốc độ xóa trang có thể đặc biệt hữu ích sau sự kiện hack khi tin tặc đăng hàng ngàn trang spam. Đó là những loại trang mà nhà xuất bản web không muốn liên kết với trang web của họ. John Mueller đã xác nhận rằng mã trạng thái 410 có thể tăng tốc quá trình xóa các trang không mong muốn đó khỏi chỉ mục của Google.

Thông số kỹ thuật mã trạng thái 410 chính thức

Dưới đây là thông số kỹ thuật chính thức cho mã trạng thái 410 :
Khách hàng có khả năng chỉnh sửa liên kết NÊN xóa các tham chiếu đến URI yêu cầu sau khi người dùng phê duyệt. Phản hồi 410 chủ yếu nhằm hỗ trợ nhiệm vụ bảo trì web bằng cách thông báo cho người nhận rằng tài nguyên không có chủ ý và chủ sở hữu máy chủ mong muốn điều khiển từ xa liên kết đến tài nguyên đó được loại bỏ.
Không cần thiết phải đánh dấu tất cả các tài nguyên không có sẵn vĩnh viễn như là đã biến mất hoặc để giữ dấu trong bất kỳ khoảng thời gian nào - đó là tùy theo quyết định của chủ sở hữu máy chủ.
Phần về xóa nên xóa xóa đặc biệt quan trọng. Nó không xác định rằng các khách hàng của Google phải xóa các tham chiếu, chỉ có điều họ nên làm. Google trong lịch sử rất tốt về việc bỏ 410 trang mã trạng thái và tuân thủ các thông số kỹ thuật chính thức.

Hướng dẫn trước đây của Google về 404 và 410

Phản hồi của John Mueller tương tự như hướng dẫn do Matt Cutts đưa ra khi anh ta từng làm việc cho Google. Matt đề nghị Google sẽ phản hồi mã trạng thái 404 bằng cách đợi 24 giờ trước khi bắt đầu quá trình xóa trang khỏi chỉ mục của nó.
Điều này là để chứng minh chỉ số của Google chống lại một lỗi hoặc sự kiện tình cờ tại trang web. Ví dụ: máy chủ web có thể ngừng hoạt động hoặc quá trình di chuyển trang có thể mất nhiều thời gian hơn dự kiến. John Mueller của Google đã không bình luận nếu đây vẫn là trường hợp. Đây là những gì hướng dẫn của Matt Cutts là:
Sau đó, hóa ra các quản trị web tự bắn vào chân mình khá thường xuyên. Trang bị mất tích. Mọi người hiểu sai các trang web. Các trang web đi xuống. Mọi người chặn GoogleBot một cách tình cờ.
Vì vậy, nếu bạn nhìn vào toàn bộ web, nhóm thu thập thông tin phải thiết kế để mạnh mẽ chống lại điều đó. Vì vậy, với 404, cùng với tôi nghĩ là 401 và có thể 403, nếu chúng ta thấy một trang và chúng ta nhận được 404, chúng ta sẽ bảo vệ trang đó trong 24 giờ trong hệ thống thu thập dữ liệu.
Vì vậy, chúng tôi sắp xếp chờ đợi và chúng tôi nói, có lẽ đó là một 404 tạm thời. Có lẽ nó không thực sự là một trang không tìm thấy.
Và trong hệ thống thu thập thông tin, nó sẽ được bảo vệ trong 24 giờ.
Nếu chúng ta thấy một chiếc 410, thì hệ thống thu thập thông tin cho biết, Ok, chúng tôi cho rằng quản trị viên web biết họ đang làm gì để họ ngay lập tức chuyển đổi 410 đó thành một lỗi thay vì bảo vệ nó trong 24 giờ.
Chúng tôi vẫn sẽ quay lại và kiểm tra lại và đảm bảo rằng các trang đó đã thực sự biến mất hoặc có thể các trang đã hoạt động trở lại.
Và tôi sẽ không dựa vào giả định rằng hành vi đó sẽ luôn giống hệt nhau.
Và vì vậy, nếu một trang không còn hoạt động thì sẽ phục vụ 404. Nếu bạn biết nó thực sự biến mất, thì việc phục vụ 410 là tốt.
Nhưng chúng tôi sẽ thiết kế hệ thống thu thập thông tin của chúng tôi mạnh mẽ. Nhưng nếu trang web của bạn bị sập hoặc nếu bạn bị hack hoặc bất cứ điều gì, chúng tôi cố gắng đảm bảo rằng chúng tôi vẫn có thể tìm thấy nội dung tốt bất cứ khi nào có sẵn.

Không có nhận xét nào:

Đăng nhận xét