SEO Checker — Auditoría SEO Completa

Google Search 2025

Estado del SEO en 2025

Google ha evolucionado significativamente sus algoritmos. Conoce las reglas actuales para aparecer y destacar en los resultados de búsqueda.

📋 Google Search Essentials

Antes conocidas como "Webmaster Guidelines", las Google Search Essentials definen los requisitos mínimos para que tu contenido sea elegible para aparecer en Google Search. Se dividen en tres pilares fundamentales:

⚙️

Requisitos Técnicos

Lo mínimo que Google necesita de una página para mostrarla en resultados. La mayoría de sitios los cumplen sin darse cuenta: el servidor debe responder correctamente, el contenido debe ser accesible y no bloqueado por robots.txt de forma accidental.

🚫

Políticas Anti-Spam

Comportamientos que pueden llevar a un sitio a ser clasificado más bajo o eliminado completamente de los resultados. Incluye cloaking, keyword stuffing, link spam, contenido generado masivamente sin valor y abuso de dominios expirados.

✅

Mejores Prácticas

Crear contenido útil y confiable centrado en las personas. Usar palabras que la gente usaría para buscar tu contenido. Hacer que los enlaces sean rastreables. Promocionar tu sitio en comunidades relevantes.

⚡ Core Web Vitals

Las métricas fundamentales que Google utiliza para medir la calidad de la experiencia del usuario. Cada métrica representa una faceta distinta: carga, interactividad y estabilidad visual. Se miden en el percentil 75 de las cargas de página.

≤2.5s

Largest Contentful Paint

Mide el rendimiento de carga. El tiempo que tarda en renderizarse el elemento de contenido más grande visible en el viewport.

✓ Bueno

≤200ms

Interaction to Next Paint

Mide la interactividad. Reemplazó a FID en marzo de 2024. Mide la latencia de todas las interacciones del usuario durante toda la vida de la página.

✓ Bueno

≤0.1

Cumulative Layout Shift

Mide la estabilidad visual. Cuánto se mueven inesperadamente los elementos visibles durante la carga de la página.

✓ Bueno

📊 Otras métricas Web Vitals importantes

Time to First Byte (TTFB): Tiempo hasta el primer byte. Ideal: ≤800ms. Mide la rapidez del servidor.
First Contentful Paint (FCP): Tiempo hasta el primer contenido visible. Ideal: ≤1.8s.
Total Blocking Time (TBT): Métrica de laboratorio que ayuda a diagnosticar problemas de INP.

🎓 E-E-A-T: Experience, Expertise, Authoritativeness, Trustworthiness

El framework que Google utiliza para evaluar la calidad de las páginas, especialmente en temas que afectan la salud, finanzas, seguridad y bienestar (YMYL - Your Money Your Life).

🧠

Experience (Experiencia)

El creador del contenido tiene experiencia real y directa sobre el tema. No se trata solo de conocimiento teórico, sino de haber vivido o practicado lo que se describe. Ejemplo: una reseña de producto escrita por alguien que realmente lo usó.

🎓

Expertise (Conocimiento)

El nivel de conocimiento y habilidad del creador en el tema. Para temas médicos, se espera que el autor sea un profesional de la salud. Para temas de hobbies, puede ser un entusiasta experimentado.

🏆

Authoritativeness (Autoridad)

El reconocimiento del creador y del sitio web como fuente de referencia en su campo. Se mide por menciones en otros sitios de autoridad, backlinks de calidad, citas y reconocimiento de la comunidad.

🛡️

Trustworthiness (Confianza)

El nivel de confianza que los usuarios pueden tener en el contenido, el autor y el sitio. Factores: HTTPS, políticas de privacidad claras, información de contacto, reseñas positivas, ausencia de errores factuales.

📝 Helpful Content System

Sistema automatizado de Google que genera un signal utilizado por el algoritmo de ranking para recompensar el contenido que satisface a los visitantes y penalizar el contenido creado principalmente para rankear en buscadores.

⚠️ Señales de contenido poco útil

Contenido creado principalmente para atraer visitas de motores de búsqueda, no para ayudar a humanos
Producción de contenido a gran escala sin valor añadido (incluyendo uso de IA sin supervisión)
Resumir contenido de otros sitios sin aportar valor original
Contenido que deja la sensación de no haber sido escrito por una persona con experiencia real
Títulos clickbait que no cumplen lo prometido
Contenido que promete responder una pregunta pero en realidad no lo hace

✅ Señales de contenido útil

El contenido demuestra experiencia real y profunda en el tema
Hay una meta clara y el contenido la cumple satisfactoriamente
El contenido es original, único y aporta perspectivas nuevas
La página principal tiene un propósito claro y enfocado
Después de leer el contenido, el visitante se siente satisfecho y no necesita buscar más
El contenido sigue las directrices de calidad de Google

📱 Mobile-First Indexing

Desde octubre de 2023, Google utiliza exclusivamente el Googlebot para smartphones para rastrear e indexar todas las páginas nuevas. Esto significa que la versión móvil de tu sitio es la que determina tu ranking, independientemente de cómo se vea en desktop.

✅

Mejores Prácticas Móvil

Asegúrate de que el contenido sea idéntico en móvil y desktop. Usa diseño responsive. Los elementos interactivos deben estar espaciados adecuadamente (mínimo 48x48px). Evita pop-ups intrusivos que cubran todo el contenido.

❌

Errores Comunes

Tener menos contenido en la versión móvil que en desktop. Usar formatos de video no reproducibles en móviles. Imágenes que no se cargan correctamente en pantallas pequeñas. Texto demasiado pequeño para leer sin zoom.

Fundamentos Técnicos

Indexación y Crawling

Entender cómo Google descubre, rastrea e indexa tu contenido es el fundamento de cualquier estrategia SEO exitosa.

🔄 Ciclo de Vida de una URL

Descubrimiento

Google encuentra la URL

→

Crawling

Googlebot visita la página

→

Indexación

Se añade al índice de Google

→

Ranking

Aparece en resultados de búsqueda

💡 Fuentes de Descubrimiento

Google descubre URLs a través de: enlaces internos y externos, sitemaps XML enviados a Search Console, envío manual de URLs, feeds RSS/Atom, y menciones en redes sociales. Las páginas sin enlaces que apunten a ellas (páginas orphan) son mucho más difíciles de descubrir.

📊 Estados de Indexación

Estado	Descripción	¿Aparece en Google?	Solución
Indexado	La página está en el índice de Google y puede aparecer en resultados	✅ Sí	No requiere acción
Indexado (no en sitemap)	Google la indexó pero no fue a través del sitemap enviado	✅ Sí	Añadir al sitemap para mejor control
Indexado con problemas	Está indexada pero tiene problemas técnicos detectados	⚠️ Parcialmente	Revisar Search Console y corregir
No indexado	Google no ha indexado la página. Puede deberse a noindex, bloqueo en robots.txt, o no descubierta	❌ No	Eliminar noindex, verificar robots.txt, crear enlaces internos
Indexado erróneamente	Google indexó una versión incorrecta (parámetros URL, versión HTTP, duplicados)	⚠️ Sí, pero mal	Canonical tags, redirecciones 301, parámetros en Search Console
Excluida por 'noindex'	La etiqueta meta robots contiene 'noindex'	❌ No	Eliminar la etiqueta noindex si se desea indexar
Bloqueada por robots.txt	El archivo robots.txt impide que Googlebot rastree la URL	❌ No (puede indexar URL sin snippet)	Modificar robots.txt para permitir el rastreo
Soft 404	La página devuelve 200 OK pero muestra contenido de "no encontrado"	⚠️ Riesgo de eliminación	Devolver código HTTP 404 real o 410 Gone

🤖 Robots.txt

El archivo robots.txt le dice a los crawlers qué URLs pueden o no rastrear. Importante: Google puede indexar URLs bloqueadas por robots.txt (sin snippet), pero no puede indexar su contenido. Para evitar la indexación, usa noindex.

# Ejemplo de robots.txt óptimo
User-agent: *
Allow: /
Disallow: /admin/
Disallow: /api/
Disallow: /private/
Disallow: /*?*sort=  # Bloquear parámetros de ordenamiento

# Permitir recursos necesarios para renderizado
User-agent: Googlebot
Allow: /css/
Allow: /js/
Allow: /assets/

# Sitemap
Sitemap: https://ejemplo.com/sitemap.xml
Sitemap: https://ejemplo.com/sitemap-images.xml

⚠️ Reglas Importantes de robots.txt

Debe estar en la raíz del dominio: https://ejemplo.com/robots.txt
Google ignora crawl-delay (no es parte del estándar que Google soporta)
Tamaño máximo: 500 KiB. Todo lo que exceda se ignora.
Soporta wildcards: * (0+ caracteres) y $ (fin de URL)
Google cachéa robots.txt por hasta 24 horas
El orden de reglas: la más específica por longitud de path gana

🏷️ Meta Robots Tags

Directiva	Efecto	Uso recomendado
`noindex`	No indexar la página en Google	Páginas de gracias, resultados de búsqueda interna, páginas duplicadas
`nofollow`	No seguir los enlaces de la página	Comentarios, UGC no moderado, enlaces de pago no marcados
`noindex, nofollow`	No indexar y no seguir enlaces	Páginas de admin, login, contenido temporal
`nosnippet`	No mostrar snippet en resultados	Contenido premium, datos sensibles
`noarchive`	No mostrar enlace "En caché"	Contenido que cambia frecuentemente
`max-snippet:[number]`	Limitar longitud del snippet en caracteres	Controlar cuánto se muestra en resultados
`max-image-preview:[size]`	Controlar tamaño de preview de imagen	none, standard, large

🔗 Canonical Tags

Indican a Google la URL preferida cuando existen múltiples versiones de una misma página. El orden de prioridad de señales es: Redirecciones > rel="canonical" > Sitemap.

✅

Mejores Prácticas

Usa URLs absolutas (https://...). Coloca el canonical en el <head> válido. Asegúrate de que todas las versiones duplicadas apunten al mismo canonical. Si usas hreflang, el canonical debe estar en el mismo idioma. No uses robots.txt para canonicalización.

❌

Errores Comunes

Especificar diferentes canonicals con diferentes métodos. Usar noindex para canonicalización (bloquea completamente). Canonicalizar a una página 404. Canonicals en cadenas (A→B→C). Canonicals que apuntan a URLs con parámetros de tracking.

🗺️ Sitemap XML

Los sitemaps ayudan a Google a descubrir páginas nuevas y actualizadas. Importante: Google ignora los valores <priority> y <changefreq>. Solo usa <lastmod> si es verificablemente preciso.

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://www.ejemplo.com/pagina.html</loc>
    <lastmod>2025-01-15</lastmod>
  </url>
</urlset>

📏 Límites del Sitemap

Tamaño máximo: 50MB sin comprimir por archivo
URLs máximas: 50,000 URLs por archivo
Encoding: UTF-8 obligatorio
URLs: Deben ser absolutas (https://...)
Ubicación: Recomendado en la raíz del sitio
Si excedes los límites, usa un sitemap index

🚨 Problemas Comunes de Indexación

🔗

Páginas Orphan

Páginas que no tienen ningún enlace interno que apunte a ellas. Google las descubre con dificultad. Solución: Asegúrate de que cada página importante tenga al menos un enlace interno desde otra página indexada.

🔄

Redirect Chains

Cadenas de redirecciones (A→B→C→D). Gastan crawl budget y diluyen link equity. Solución: Mantén las cadenas a máximo 3 saltos. Idealmente, redirige directamente A→D.

📄

Contenido Duplicado

Múltiples URLs con contenido idéntico o muy similar. Divide la autoridad entre versiones. Solución: Usa canonical tags, redirecciones 301, o consolida el contenido en una única URL.

💰

Crawl Budget

El número de páginas que Google rastrea en tu sitio en un período dado. Sitios grandes (>10k URLs) deben optimizarlo. Solución: Elimina páginas de baja calidad, mejora la velocidad del servidor, evita parámetros URL innecesarios.

Ecosistema SEO

Herramientas Disponibles

Inventario completo de herramientas gratuitas de Google y terceros, más utilidades ejecutables server-side para auditorías propias.

🔵 Herramientas de Google

🔍

Search Console

search.google.com/search-console

El centro de control obligatorio. Reportes de rendimiento, cobertura de indexación, Core Web Vitals, experiencia de página, enlaces y más. Esencial para cualquier sitio web.

Gratuita Esencial

⚡

PageSpeed Insights

pagespeed.web.dev

Analiza el rendimiento de cualquier URL con datos de laboratorio (Lighthouse) y datos reales de usuarios (CrUX). Proporciona diagnósticos y sugerencias específicas.

Gratuita Core Web Vitals

📱

Mobile-Friendly Test

search.google.com/test/mobile-friendly

Verifica si una página está optimizada para dispositivos móviles. Muestra problemas específicos como texto pequeño, elementos táctiles cercanos, o viewport incorrecto.

Gratuita Mobile

⭐

Rich Results Test

search.google.com/test/rich-results

Prueba el structured data (Schema.org) de una página para ver qué rich results puede generar. Muestra errores y advertencias en la implementación de schema.

Gratuita Schema

📊

Schema Markup Validator

validator.schema.org

Valida cualquier tipo de Schema.org markup (JSON-LD, Microdata, RDFa). No solo rich results, sino toda la ontología de Schema.org.

Gratuita Schema

📈

Google Trends

trends.google.com

Descubre tendencias de búsqueda en tiempo real, compara términos, encuentra temas relacionados y analiza el interés geográfico. Ideal para investigación de keywords.

Gratuita Keywords

🎯

Keyword Planner

ads.google.com

Herramienta de Google Ads para investigar keywords. Muestra volumen de búsqueda, competencia y sugerencias. Requiere cuenta de Google Ads (gratis crearla).

Gratuita Keywords

📉

Google Analytics 4

analytics.google.com

Analítica web avanzada. Aunque no es una herramienta SEO pura, proporciona datos cruciales sobre tráfico orgánico, comportamiento de usuarios y conversiones.

Gratuita Analytics

🔧

Chrome DevTools

Built-in Chrome

Panel de rendimiento (Performance), Lighthouse integrado, análisis de cobertura CSS/JS, simulación de dispositivos móviles, y auditoría de accesibilidad.

Gratuita Dev

🟣 Herramientas de Terceros (Gratuitas)

🐸

Screaming Frog

screamingfrog.co.uk

Crawler desktop profesional. Versión gratuita limitada a 500 URLs. Analiza títulos, meta descriptions, headers, enlaces rotos, imágenes, canonicals y más.

Freemium 500 URLs

🌐

GTmetrix

gtmetrix.com

Análisis de rendimiento web con informes detallados. Muestra Waterfall, Lighthouse scores, y recomendaciones de optimización. Plan gratuito con limitaciones.

Freemium Performance

🧪

WebPageTest

webpagetest.org

Pruebas de rendimiento desde múltiples ubicaciones y dispositivos reales. Waterfall detallado, filmstrip visual, y comparación de tests. Muy completo y gratuito.

Gratuita Performance

💡

Ubersuggest

neilpatel.com/ubersuggest

Investigación de keywords, análisis de competencia, ideas de contenido y auditoría SEO básica. Plan gratuito con límites diarios de búsquedas.

Freemium Keywords

❓

AnswerThePublic

answerthepublic.com

Visualiza preguntas reales que la gente hace sobre cualquier tema. Ideal para generar ideas de contenido. Plan gratuito limitado a 3 búsquedas/día.

Freemium Content

🔗

Ahrefs Webmaster Tools

ahrefs.com/webmaster-tools

Acceso gratuito a datos de backlinks, keywords orgánicas y auditoría técnica para sitios que verifiques. Muy potente para análisis de competencia.

Gratuita Backlinks

📋

Moz Link Explorer

moz.com/link-explorer

Análisis de backlinks, Domain Authority (DA) y Page Authority (PA). Plan gratuito con 10 consultas/mes. Datos históricos de enlaces.

Freemium 10/mes

🔌

Yoast / RankMath

wordpress.org/plugins

Plugins SEO para WordPress. Análisis on-page en tiempo real, generación de sitemaps, control de robots meta, schema markup, y redirecciones.

Gratuita WordPress

✓

W3C Validator

validator.w3.org

Valida el markup HTML de cualquier página. Detecta errores de sintaxis, etiquetas mal anidadas, atributos obsoletos y problemas de accesibilidad.

Gratuita HTML

🖥️ Herramientas Server-Side (Ejecutables)

Estas son herramientas que podemos ejecutar directamente en nuestro servidor para construir una plataforma de auditoría SEO propia, sin depender de APIs de pago.

⚡

Lighthouse CLI

npm install -g lighthouse

Audita rendimiento, accesibilidad, best practices y SEO de cualquier URL. Genera reportes HTML/JSON programáticamente. Ideal para integrar en pipelines CI/CD.

🌐

cURL / wget

curl -I https://ejemplo.com

Analizar headers HTTP, códigos de estado, redirecciones, HSTS, caching policies. Esencial para auditorías técnicas server-side.

🔍

grep / awk / sed

grep -o '<title>.*</title>'

Extraer títulos, meta descriptions, headers H1-H6, enlaces, alt text de imágenes directamente del HTML descargado.

📄

xmllint

xmllint --noout sitemap.xml

Validar sintaxis XML de sitemaps. Verificar estructura, namespaces y entidades escapadas correctamente.

🔒

openssl

openssl s_client -connect host:443

Verificar certificados SSL/TLS, fechas de expiración, cadena de confianza, protocolos soportados y configuración de cipher suites.

🤖

Puppeteer + Node.js

npm install puppeteer cheerio

Crawling con renderizado JavaScript. Extraer datos de SPAs, ejecutar Lighthouse programáticamente, generar screenshots y PDFs de reportes.

Diseño de Sistema

Arquitectura SEO Checker Engine

Diseño estructural de una plataforma de auditoría SEO completa que se ejecuta 100% en nuestro servidor, sin dependencias de APIs de pago.

🏗️ Diagrama de Componentes

Frontend / Cliente

🖥️

Dashboard Web

React / Vue / HTML estático

📊

Visualización

Chart.js / D3.js para métricas

📄

Export Reports

PDF / HTML / JSON descargables

↓

API / Backend

⚙️

REST API

Node.js/Express o Python/FastAPI

📋

Job Queue

Bull / Celery + Redis

💾

Database

PostgreSQL / MongoDB

↓

Módulos de Auditoría

🕷️

Crawler

Descubrimiento de URLs

📄

On-Page

Títulos, meta, headers

🔧

Technical

Robots, sitemap, SSL

⚡

Performance

Lighthouse, TTFB, size

📝

Content

Keywords, readability

🔗

Links

Internos, externos, rotos

↓

Infraestructura / Servidor

🐧

Linux Server

Ubuntu / Debian

🌐

Nginx

Reverse proxy + SSL

🐳

Docker

Containerización

📦 Módulos del Engine

🕷️

Crawler Module

Función: Descubrir todas las URLs internas y externas de un sitio.

Implementación:

Node.js: axios + cheerio para HTML estático
Node.js: puppeteer para SPAs con JavaScript
Python: Scrapy o BeautifulSoup4 + requests
Respetar robots.txt y crawl-delay
Rate limiting: máx 10 req/segundo por dominio
Detectar y manejar redirecciones (301, 302)

📄

On-Page Analyzer

Función: Analizar elementos on-page de cada URL.

Métricas:

Título (<title>): longitud (50-60 chars ideal)
Meta description: longitud (150-160 chars ideal)
Headers H1-H6: estructura jerárquica
Alt text de imágenes: presencia y calidad
Schema.org / JSON-LD: tipos detectados
Open Graph y Twitter Cards
Canonical tag y hreflang

🔧

Technical SEO Module

Función: Verificar aspectos técnicos fundamentales.

Verificaciones:

robots.txt: existencia, sintaxis, reglas
Sitemap XML: validez, URLs, lastmod
SSL/TLS: certificado válido, expiración, cadena
HTTPS: redirección de HTTP a HTTPS
HSTS header presente
Security headers (CSP, X-Frame-Options, etc.)
URL structure: parámetros, friendly URLs

⚡

Performance Module

Función: Medir velocidad y rendimiento.

Métricas:

Lighthouse scores (Performance, Accessibility, SEO, Best Practices)
TTFB (Time to First Byte)
Page size (HTML, CSS, JS, imágenes)
Número de requests
Compresión Gzip/Brotli habilitada
Resource hints (preload, prefetch)
Lazy loading de imágenes

📝

Content Analyzer

Función: Analizar calidad y estructura del contenido.

Métricas:

Keyword density (1-2% ideal)
Readability score (Flesch-Kincaid)
Longitud del contenido
Ratio texto/HTML
Detección de contenido duplicado interno
Análisis de sentimiento (opcional)
Entities y topics (NLP básico)

🔗

Link Analyzer

Función: Analizar estructura de enlaces.

Métricas:

Enlaces internos totales y únicos
Enlaces externos (outbound)
Enlaces rotos (404)
Redirects (301, 302)
Atributos rel (nofollow, sponsored, ugc)
Anchor text distribution
Páginas orphan (sin enlaces internos)

🛠️ Stack Tecnológico Recomendado

Capa	Tecnología	Alternativa	Justificación
Frontend	React + Tailwind CSS	Vue.js / HTML estático	Componentes reutilizables, dashboards interactivos
Backend API	Node.js + Express	Python + FastAPI	Excelente ecosistema de scraping (puppeteer, cheerio)
Database	PostgreSQL	MongoDB	Datos estructurados de auditorías, relaciones complejas
Job Queue	Bull + Redis	BullMQ / Celery	Procesar auditorías en background, retries, prioridades
Scraping	Puppeteer + Cheerio	Playwright / Scrapy	Renderizado JS + parsing HTML rápido
Reporting	Puppeteer (PDF)	wkhtmltopdf / Playwright	Generar PDFs profesionales desde HTML/CSS
Charts	Chart.js	D3.js / Recharts	Visualizaciones de métricas SEO
Infraestructura	Docker + Nginx	PM2 / systemd	Containerización, reverse proxy, SSL

Domina el Posicionamiento en Google

Estado del SEO en 2025

📋 Google Search Essentials

Requisitos Técnicos

Políticas Anti-Spam

Mejores Prácticas

⚡ Core Web Vitals

📊 Otras métricas Web Vitals importantes

🎓 E-E-A-T: Experience, Expertise, Authoritativeness, Trustworthiness

Experience (Experiencia)

Expertise (Conocimiento)

Authoritativeness (Autoridad)

Trustworthiness (Confianza)

📝 Helpful Content System

⚠️ Señales de contenido poco útil

✅ Señales de contenido útil

📱 Mobile-First Indexing

Mejores Prácticas Móvil

Errores Comunes

Indexación y Crawling

🔄 Ciclo de Vida de una URL

Descubrimiento

Crawling

Indexación

Ranking

💡 Fuentes de Descubrimiento

📊 Estados de Indexación

🤖 Robots.txt

⚠️ Reglas Importantes de robots.txt

🏷️ Meta Robots Tags

🔗 Canonical Tags

Mejores Prácticas

Errores Comunes

🗺️ Sitemap XML

📏 Límites del Sitemap

🚨 Problemas Comunes de Indexación

Páginas Orphan

Redirect Chains

Contenido Duplicado

Crawl Budget

Herramientas Disponibles

🔵 Herramientas de Google

🟣 Herramientas de Terceros (Gratuitas)

🖥️ Herramientas Server-Side (Ejecutables)

Lighthouse CLI

cURL / wget

grep / awk / sed

xmllint

openssl

Puppeteer + Node.js

Arquitectura SEO Checker Engine

🏗️ Diagrama de Componentes

Dashboard Web

Visualización

Export Reports

REST API

Job Queue

Database

Crawler

On-Page

Technical

Performance

Content

Links

Linux Server

Nginx

Docker

📦 Módulos del Engine

Crawler Module

On-Page Analyzer

Technical SEO Module

Performance Module

Content Analyzer

Link Analyzer

🛠️ Stack Tecnológico Recomendado

Roadmap del Proyecto

Fase 1: Investigación y Landing

Fase 2: API de Auditoría Básica

Fase 3: Crawler y Dashboard

Fase 4: Reportes Avanzados

Domina el Posicionamiento
en Google