웹사이트 검색

Sitemap.xml 파일: 용도, 사용 방법, URL이 너무 많음 오류 및 크기 제한을 우회하는 방법


목차

  1. Sitemap이란 무엇입니까?
  2. 사이트맵 파일에 대한 제한 사항은 무엇입니까
  3. 사이트맵 파일을 압축하는 방법
  4. 여러 사이트맵을 사용할 수 있습니까?
  5. 사이트맵 파일의 구조는 무엇입니까
  6. 사이트맵 파일을 생성하는 방법
  7. 사이트맵을 Google Search Console로 가져오는 방법
  8. Sitemap.xml 파일 상태 가져오지 못함
  9. sitemap.xml 파일을 사용해야 합니까?
  10. 사이트맵에 오류가 있는 경우 수행할 작업입니다. Google Search Console에서 사이트맵 파일을 제거하는 방법

Sitemap이란 무엇입니까?

사이트맵은 사이트 페이지의 URL 목록을 포함하는 XML 형식 파일로, Google 검색 엔진에 제출하여 신속하게 찾아 색인을 생성할 수 있습니다.

사이트맵 파일에 대한 제한 사항은 무엇입니까

  1. 파일 크기는 50MB 이하여야 합니다.
  2. 한 파일에 50,000개 이상의 링크가 있을 수 없습니다.

사이트맵 파일을 압축하는 방법

XML 마크업이 있는 간단한 텍스트 형식 외에도 파일을 .gz 아카이브로 압축할 수 있습니다. 이 경우 텍스트 파일이 매우 잘 압축되기 때문에 파일 크기가 크게 줄어듭니다. 예를 들어 25MB 파일이 500KB 파일로 압축되었습니다.

이렇게 하려면 원본 sitemap.xml 파일을 .gz 형식으로 압축하면 됩니다. Google Search Console의 링크로 아카이브 경로를 지정해야 합니다(예: https://site.net/sitemap.xml.gz).

웹 브라우저에서 https://site.net/sitemap.xml.gz 파일을 열려고 하면 와 같이 콘텐츠가 표시되지 않고 컴퓨터에 다운로드됩니다. >sitemap.xml 파일에 있는 경우 정상입니다. 어느 쪽이든 Google Search Console은 이 파일을 처리할 수 있습니다.

여러 사이트맵을 사용할 수 있습니까?

각 사이트 또는 도메인 리소스에 대해 여러 개의 사이트맵을 만들고 모두 Google Search Console로 가져올 수 있습니다. 이는 허용될 뿐만 아니라 사이트맵이 너무 큰 경우 Google 자체에서 권장합니다.

Sitemap 파일이 많은 경우 전체 목록을 별도의 Sitemap 파일에 수집할 수 있습니다. 이 파일을 사이트맵 색인 파일이라고 합니다. sitemap.xml 파일 내용의 예:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
	<sitemap>
		<loc>https://site.net/sitemaps/sitemap_1.xml</loc>
	</sitemap>
	<sitemap>
		<loc>https://site.net/sitemaps/sitemap_2.xml</loc>
	</sitemap>
	<sitemap>
		<loc>https://site.net/sitemaps/sitemap_3.xml</loc>
	</sitemap>
</sitemapindex>

그런 다음 이 기본 파일을 Google Search Console로 가져오기만 하면 됩니다.

기본 색인 파일에 나열된 나머지 사이트맵은 자동으로 Google Search Console로 가져옵니다.

파일을 보려면 파일 이름을 클릭하십시오. 가져온 Sitemap 목록이 표시됩니다.

이러한 파일이 처리되고 상태가 성공으로 변경될 때까지 기다려야 합니다.

사이트맵 파일의 구조는 무엇입니까

사이트맵 파일의 구조는 다음과 같습니다.

<?xml version="1.0" encoding="utf-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
	<url>
		<loc>https://domain.site.net/?p=1</loc>
		<lastmod>2022-10-08T14:14:27+00:00</lastmod>
		<changefreq>monthly</changefreq>
		<priority>0.8</priority>
	</url>
<url>
	<loc>https://domain.site.net/?p=2</loc>
		<lastmod>2022-10-08T14:14:27+00:00</lastmod>
		<changefreq>monthly</changefreq>
		<priority>0.8</priority>
	</url>
	<url>
		<loc>https://domain.site.net/?p=3</loc>
		<lastmod>2022-10-08T14:14:27+00:00</lastmod>
		<changefreq>monthly</changefreq>
		<priority>0.8</priority>
	</url>
</urlset>

각 항목은 다음 네 가지 요소로 구성됩니다.

  1. URL
  2. 마지막 수정 날짜
  3. 수정 빈도(예: 월간)
  4. 우선순위

사이트맵 파일을 생성하는 방법

WordPress를 사용하는 경우 가장 쉬운 방법은 사이트맵 플러그인을 설치하는 것입니다.

사이트 엔진용 사이트맵 플러그인이 없는 경우 XML 마크업이 포함된 텍스트 파일이므로 직접 생성하기가 매우 쉽습니다.

사이트맵을 Google Search Console로 가져오는 방법

Google Search Console로 이동하여 사이트맵을 보고할 사이트를 선택하고 사이트맵의 URL을 입력합니다.

Sitemap.xml 파일 상태 가져오지 못함

처음에는 sitemap.xml 파일이 가져오지 못했습니다라는 비문이 나타날 수 있습니다. 이 비문은 sitemap.xml 파일에 모든 것이 정상인 경우에도 나타납니다. 조금만 기다리면 됩니다.

결론은 이 비문이 sitemap.xml 파일에 문제가 있다는 것을 의미하지 않는다는 것입니다. 이 파일을 분석할 차례가 아직 오지 않은 것뿐입니다.

잠시 후 파일 상태가 성공으로 변경됩니다. 동시에 이 파일 덕분에 공개된 URL 수를 표시합니다.

나중에도 sitemap.xml 파일에서 링크 인덱싱 보고서를 볼 수 있습니다.

sitemap.xml 파일을 사용해야 합니까?

사실 저는 보통 sitemap.xml 파일을 사용하지 않습니다. 나는 대부분의 사이트에 수동으로 기사를 추가하는데, 이러한 사이트의 페이지는 매우 빠르게 인덱싱되기 때문에 sitemap.xml 파일이 특별히 필요하지 않다고 생각합니다.

그러나 사이트의 인덱싱 속도가 만족스럽지 않거나 인덱싱할 많은 수의 URL을 신속하게 보고해야 하는 경우에는 sitemap.xml 파일을 사용해 보십시오.

사이트맵에 오류가 있는 경우 수행할 작업입니다. Google Search Console에서 사이트맵 파일을 제거하는 방법

Sitemap 처리를 시도한 후 Sitemap에 오류(예: 잘못된 날짜 형식 또는 끊어진 링크)가 있음을 발견하면 다음 크롤링 시간이 될 때까지 기다릴 필요가 없습니다.

Google Search Console에서 사이트맵을 삭제하고 바로 다시 추가할 수 있습니다. 그 후, 아주 빠르게(몇 분 이내) Google은 Sitemap 파일을 다시 확인합니다.

Google 검색에서 Sitemap 파일을 제거하려면 해당 파일을 클릭하십시오. 열리는 페이지의 오른쪽 상단에서 세 개의 가로 점이 있는 버튼을 찾습니다. 사이트맵을 클릭하고 '사이트맵 삭제'를 선택합니다.

그런 다음 Sitemap 파일은 삭제되며 오류를 수정한 후 동일하거나 다른 URL로 Sitemap 파일을 즉시 다시 추가할 수 있습니다.