Εάν ο ιστότοπός σας έχει πανομοιότυπο ή πολύ παρόμοιο περιεχόμενο διαθέσιμο σε διαφορετικές διευθύνσεις URL, τότε η νέα μορφή θα σας επιτρέψει να καθορίσετε τη διεύθυνση URL που θα πρέπει να επιστραφεί από τη μηχανή αναζήτησης. Μπορείτε επίσης να είστε σίγουροι ότι όλα τα χαρακτηριστικά όπως ο χυμός συνδέσμων κ.λπ. θα μεταφερθεί στην απαιτούμενη έκδοση της διεύθυνσης.

Τώρα μπορείτε να προσθέσετε αυτήν την ετικέτα για να υποδείξετε την έκδοση της διεύθυνσης μέσα στην ετικέτα σε σελίδες με διπλό περιεχόμενο:

Με αυτόν τον τρόπο, η Google θα κατανοήσει ότι όλα τα διπλότυπα συνδέονται με την κανονική διεύθυνση που καθορίζεται στην ετικέτα. Πρόσθετες ιδιότητες διεύθυνσης, όπως το PageRank και τα σχετικά σήματα, θα μεταφερθούν επίσης από διπλότυπες σελίδες στην καθορισμένη.

Μια τέτοια ετικέτα θα είναι χρήσιμη κυρίως όταν χρησιμοποιείτε διάφορες μηχανές (phpBB, IPB, WordPress κ.λπ., για παράδειγμα, τον ιστότοπο ipbskins.ru - ανάπτυξη σχεδίασης ιστότοπου στο IPB, πρέπει να χρησιμοποιήσετε ένα μακρύ robots.txt για να αποφύγετε διπλότυπα περιεχόμενο), δημιουργώντας πολλές παρόμοιες σελίδες, για παράδειγμα, αυτές θα μπορούσαν να είναι σελίδες:

έντυπη έκδοση του άρθρου:
http://site.ru/article01.html?print=true
έκδοση κειμένου άρθρων για κινητά. τηλέφωνα:
http://site.ru/lofiversion/article01.html
διπλό λόγω έλλειψης κινητήρα:
http://site.ru/articles/?id=1&category=new
http://site.ru/articles/?id=1&tag=keyword
και μια σειρά από άλλα...

Αυτό το πρότυπο μπορεί να προσαρμοστεί από οποιαδήποτε μηχανή αναζήτησης κατά την ευρετηρίαση ενός ιστότοπου.

Το κανονικό πρόσθετο έχει ήδη αναπτυχθεί για τη δημοφιλή μηχανή blog WordPress, η οποία εισάγει την ετικέτα στις απαιτούμενες σελίδες. Άλλες δημοφιλείς μηχανές για ιστολόγια, φόρουμ, ηλεκτρονικά καταστήματα κ.λπ. θα επεκτείνει επίσης τη λειτουργικότητά τους στο εγγύς μέλλον (μείνετε συντονισμένοι για ενημερώσεις).

Απαντήσεις σε μερικές δημοφιλείς ερωτήσεις σχετικά με την ετικέτα:

Είναι το rel=“κανονικό” υπόδειξη ή οδηγία;
Αυτή είναι μια υπόδειξη που λαμβάνουμε υπόψη και, σε αλληλεπίδραση με άλλα σήματα, υπολογίζουμε την πιο σχετική σελίδα για εμφάνιση στα αποτελέσματα αναζήτησης.

Μπορώ να χρησιμοποιήσω μια σχετική διαδρομή για να προσδιορίσω την κανονική, όπως αυτό: ?
Ναι, οι σχετικές διαδρομές αναγνωρίζονται με τον ίδιο τρόπο όπως σε μια κανονική ετικέτα . Ακόμα κι αν εισάγετε την ετικέτα με έναν σύνδεσμο προς το έγγραφο, τότε οι σχετικές διαδρομές θα υπολογιστούν σύμφωνα με τη βασική διεύθυνση URL.

Είναι εντάξει εάν οι κανονικές διευθύνσεις URL περιέχουν περιεχόμενο που δεν είναι εντελώς διπλό;
Επιτρέπουμε μικρές διαφορές όπως η σειρά ταξινόμησης στον πίνακα προϊόντων. Καταλαβαίνουμε επίσης ότι οι κανονικές διευθύνσεις μπορούν να αναλυθούν από το ρομπότ σε διαφορετικές χρονικές στιγμές, επομένως όλα αυτά είναι φυσιολογικά.

Τι γίνεται αν το rel=“canonical” επιστρέψει ένα σφάλμα 404;
Θα συνεχίσουμε να ευρετηριάζουμε το περιεχόμενό σας και να χρησιμοποιούμε μια ευρετική προσέγγιση για τον προσδιορισμό της κανονικής διεύθυνσης URL, ωστόσο, συνιστούμε να χρησιμοποιείτε υπάρχουσες διευθύνσεις URL ως κανονικές διευθύνσεις URL.

Τι γίνεται αν το rel=“canonical” δεν έχει καταχωρηθεί ακόμα;
Προσπαθούμε να φτάσουμε γρήγορα στην κανονική διεύθυνση URL. Μόλις το ευρετηριάσουμε, τότε θα επανεξετάσουμε αμέσως την υπόδειξη rel=“κανονική”.

Μπορεί μια κανονική διεύθυνση URL να περιέχει ανακατεύθυνση;
Ναι, μπορείτε να καθορίσετε μια ανακατεύθυνση, οπότε η μηχανή αναζήτησης θα επεξεργαστεί τη διαδικασία ανακατεύθυνσης ως συνήθως και θα προσπαθήσει να δημιουργήσει ευρετήριο στη νέα διεύθυνση.

Τι γίνεται αν έχω αντικρουόμενα σήματα για rel=“κανονικό”;
Οι αλγόριθμοί μας είναι μαλακοί: μπορούμε να ακολουθήσουμε κανονικές αλυσίδες, ωστόσο, συνιστούμε ανεπιφύλακτα να καθορίσετε μια μεμονωμένη κανονική διεύθυνση στις σελίδες σας για να εξασφαλίσετε ένα βέλτιστο αποτέλεσμα κανονικοποίησης.

Θα μπορούσε αυτή η ετικέτα συνδέσμου να προτείνει μια κανονική διεύθυνση σε έναν εντελώς διαφορετικό τομέα;
Οχι. Η μετεγκατάσταση σε άλλο τομέα είναι πιο κατάλληλη. Η Google υποστηρίζει προς το παρόν την κανονικοποίηση εντός υποτομέων ή εντός ενός μόνο τομέα. Με αυτόν τον τρόπο, οι κάτοχοι ιστοτόπων μπορούν να καθορίσουν www.example.comαντί example.comή help.example.com, ωστόσο, δεν μπορεί να υποδείξει example.comαντί example-widgets.com.

Ακούγεται ενδιαφέρον, αλλά μπορώ να δω ένα παράδειγμα;
Ναι, το wikia.com μας βοήθησε ως ελεγκτής εμπιστοσύνης. Για παράδειγμα, θα παρατηρήσετε ότι ο πηγαίος κώδικας στο http://starwars.wikia.com/wiki/Nelvana_Limited περιέχει rel=canonical http://starwars.wikia.com/wiki/Nelvana.

Οι δύο διευθύνσεις URL είναι σχεδόν πανομοιότυπες, με τη διαφορά ότι το Nelvana_Limited, το πρώτο URL, περιέχει ένα σύντομο μήνυμα κοντά στον τίτλο. Αυτό είναι ένα καλό παράδειγμα του τρόπου χρήσης της ετικέτας στο μέλλον. Με το rel=canonical, οι ιδιότητες των δύο διευθύνσεων συνδυάζονται και τα αποτελέσματα αναζήτησης εμφανίζουν την επιθυμητή έκδοση.

Εάν έχετε οποιεσδήποτε ερωτήσεις σχετικά με τη χρήση της νέας ετικέτας, μπορείτε να τις ρωτήσετε στα σχόλια στο επίσημο ιστολόγιο Google Webmaster.

1. Εκτός από το να απαλλαγούμε από φυσικό διπλότυπο περιεχόμενο (λόγω έλλειψης κινητήρα), απαλλαγούμε επίσης από τεχνητό διπλότυπο περιεχόμενο όταν οι ανταγωνιστές προσπαθούν να μας ενοχλήσουν προσθέτοντας .

2. Τώρα δεν χρειάζεται να χρησιμοποιήσετε το robots.txt για να απαγορεύσετε την ευρετηρίαση σελίδων όπως η "έντυπη έκδοση" και άλλα διπλότυπα (για παράδειγμα, στο WordPress ήταν απαραίτητο να κλείσετε τη διαδρομή /tag/) και παρακαλούμε κάθε μηχανή αναζήτησης ξεχωριστά ( υπάρχουν γενικά πρότυπα για το robots.txt, αλλά υπάρχουν επίσης ορισμένες ιδιαιτερότητες για το πώς λειτουργεί κάθε μηχανή αναζήτησης με αυτό το αρχείο, επομένως δεν μπορούσαμε προηγουμένως να προβλέψουμε την απαγόρευση της ευρετηρίασης ορισμένων σελίδων για όλα τα bots ταυτόχρονα).

3. Τώρα έχουμε ένα καλό εργαλείο για να επιταχύνουμε την ευρετηρίαση ιστότοπου :)

Γεια σας φίλοι!

Σήμερα θα υπάρξει ένα πολύ σημαντικό άρθρο, το οποίο διασταυρώνεται πολύ στενά με το θέμα των διπλών σελίδων.

Έτσι, εμβαθύνουμε προσεκτικά σε αυτό και, αν κάτι δεν είναι ξεκάθαρο, τότε γράψτε στα σχόλια. Το θέμα της συζήτησης είναι το χαρακτηριστικό burning rel="canonical", το οποίο έχει σχεδιαστεί για να αποτρέπει το διπλότυπο περιεχόμενο και να απλοποιεί την ευρετηρίαση από τις μηχανές αναζήτησης.
Ας δούμε κάθε θέμα με τη σειρά ώστε να προκύψει μια ολοκληρωμένη εικόνα.

Πώς λειτουργεί το χαρακτηριστικό rel="canonical".

Το κανονικό χαρακτηριστικό ή ετικέτα (όπως ονομάζεται επίσης) χρησιμοποιείται για να επιτρέπει στις μηχανές αναζήτησης να καταλάβουν ποια διεύθυνση είναι αληθής και είναι η κύρια για κάθε σελίδα στον ιστότοπο.

Το Rel="canonical" είναι ένα από τα πιο σημαντικά σημεία στη βελτιστοποίηση οποιουδήποτε ιστότοπου, το οποίο σας επιτρέπει να λύσετε το πρόβλημα του διπλού περιεχομένου. Ιδιαίτερη ανάγκη χρήσης του εμφανίζεται όταν χρησιμοποιούνται διάφορες μηχανές για τη δημιουργία ιστοσελίδων, όπως WordPress, phpBB και άλλες.

Εκτός από τις κύριες σελίδες, διάφοροι κινητήρες δημιουργούν και άλλα έγγραφα με ακριβώς το ίδιο περιεχόμενο, αλλά εκτελώντας εντελώς διαφορετικές εργασίες, για παράδειγμα:

  • εκτυπώσιμη έκδοση της σελίδας·
  • έκδοση του άρθρου για κινητά.
  • και οποιεσδήποτε άλλες σελίδες με το ίδιο περιεχόμενο, αλλά με διαφορετικές διευθύνσεις.

Εάν χρησιμοποιείτε έναν ιστότοπο WordPress, τότε όταν είναι ενεργοποιημένη η λειτουργία δενδρικών σχολίων, το κουμπί "Απάντηση" είναι διαθέσιμο κάτω από κάθε σχόλιο.

Κάνει τη διεύθυνση εντελώς διαφορετική, αλλά το περιεχόμενο παραμένει αμετάβλητο. Υπάρχει προφανής αντιγραφή περιεχομένου, κάτι που είναι πολύ κακό.

Ένας από τους πιο αποτελεσματικούς τρόπους για να αποτρέψετε την εμφάνιση μιας τέτοιας σελίδας στο ευρετήριο της μηχανής αναζήτησης είναι να προσθέσετε το χαρακτηριστικό rel="canonical" σε όλες αυτές τις σελίδες, το οποίο θα υποδεικνύει ότι μόνο το άρθρο είναι το προτιμώμενο έγγραφο για ευρετηρίαση και όλα τα άλλα δεν χρειάζεται να συμπεριληφθούν στο ευρετήριο.

Πώς να γράψετε rel="canonical"

Σε διάφορες μηχανές (για παράδειγμα, WordPress), το χαρακτηριστικό rel="canonical" προστίθεται αυτόματα. Το χαρακτηριστικό προστίθεται επίσης χρησιμοποιώντας διάφορα πρόσθετα SEO.

Αν θέλουμε να προσθέσουμε canonical σε χειροκίνητη λειτουργία, τότε στην περιοχή πόρος αξίζει να προσθέσετε την ακόλουθη γραμμή.

< link rel = "canonical" href = "адрес страницы" / >

Αυτή η γραμμή πρέπει να προστεθεί στην ενότητα κεφαλίδας ιστότοπου, δηλαδή μεταξύ του ανοίγματος και ετικέτα κλεισίματος. Διαφορετικά, οι μηχανές αναζήτησης θα αγνοήσουν την υπόδειξή σας με τη μορφή αυτού του χαρακτηριστικού. Αξίζει επίσης να το προσθέσετε σε κάθε σελίδα που δεν είναι η κύρια σελίδα και είναι προσβάσιμη σε διαφορετική διεύθυνση.

Αν πάρουμε το παράδειγμα της παραπάνω κατάστασης με τις διευθύνσεις σελίδων που δημιουργούνται από κουμπιά απάντησης σε σχόλια στο WordPress, τότε στον πηγαίο κώδικα κάθε τέτοιας σελίδας μπορείτε να δείτε το χαρακτηριστικό rel="canonical".

Όπως μπορούμε να δούμε, η κανονική διεύθυνση οδηγεί στην κύρια σελίδα όταν είδα τον πηγαίο κώδικα στη διεύθυνση:

http://i-am-kulinar.ru/poleznoe-obzory-intervyu/ne-proigral-nikto.html?replytocom=5499#respond

http: //i-am-kulinar.ru/poleznoe-obzory-intervyu/ne-proigral-nikto.html?replytocom=5499#respond

Χάρη στο χαρακτηριστικό κανονικές διευθύνσεις, μια τέτοια σελίδα δεν θα συμπεριληφθεί στο ευρετήριο. Οι μηχανές αναζήτησης θα λάβουν υπόψη τις οδηγίες σας.

Έχοντας εξετάσει τη βασική αρχή λειτουργίας αυτού του χαρακτηριστικού, μπορούμε να προχωρήσουμε στην επόμενη ερώτηση του υλικού.

Σε ποιες περιπτώσεις πρέπει να χρησιμοποιείται;


Τώρα αξίζει να εξεταστούν τα κύρια λάθη που μπορούν να γίνουν και πρέπει να αποφευχθούν.

Βασικά λάθη


Όταν έχουμε εξετάσει τα κύρια λάθη που πρέπει να αποφεύγονται και τα οποία χρησιμοποιούνται συχνότερα, αξίζει να αναφέρουμε τα πρόσθετα WordPress και ορισμένες πτυχές της εργασίας με το χαρακτηριστικό rel="canonical" σε αυτόν τον κινητήρα.

Canonical σε πρόσθετα WordPress

Ας ξεκινήσουμε με μια από τις πιο δημοφιλείς λύσεις στην αγορά - όλες σε ένα πακέτο SEO. Το πρόσθετο είναι καλό και προσθέτει αυτό το χαρακτηριστικό στον κώδικα κάθε σελίδας, ενώ αφαιρεί το τυπικό κανονικό που δημιουργήθηκε από τη μηχανή. Για να το κάνετε αυτό, θα πρέπει να ενεργοποιήσετε την κατάλληλη ρύθμιση.

Υπάρχουν 2 προβλήματα που μπορεί να επηρεάσουν την κανονική ευρετηρίαση του ιστότοπου και να βοηθήσουν τους ανταγωνιστές να μας ενοχλήσουν.

Το πρώτο σημείο αφορά τη λανθασμένη λειτουργία του χαρακτηριστικού με σελίδες σελιδοποίησης. Έγραψα παραπάνω ότι κάθε σελίδα πρέπει να είναι κανονική. Το πρόσθετο στο rel="canonical" εισάγει τη διεύθυνση στην πρώτη σελίδα (στην κύρια διεύθυνση του οιωνού) από ολόκληρη τη λίστα σελιδοποίησης.


Αυτή η επιλογή μπορεί να υπάρχει, αλλά δεν είναι απολύτως σωστή, καθώς όλες οι σελίδες σελιδοποίησης πιθανότατα μπορούν να εξαιρεθούν από το ευρετήριο PS. Εάν αυτό είναι απαράδεκτο, τότε το πρόβλημα πρέπει να λυθεί.

Το δεύτερο σημείο είναι το τζάμπ, το οποίο περιέγραψα στο αντίστοιχο άρθρο (). Μπορεί να βοηθήσει τους ανταγωνιστές μας να προσθέσουν ανεπιθύμητες σελίδες στο ευρετήριο χρησιμοποιώντας τα εργαλεία addurl στο ευρετήριο αναζήτησης. Αυτό δεν μπορεί, φυσικά, να διορθωθεί και είναι καλό που γίνεται χρησιμοποιώντας την ίδια την προσθήκη, ενεργοποιώντας μια συγκεκριμένη ρύθμιση "Χωρίς σελιδοποίηση για κανονικές διευθύνσεις URL".

Στο σημείο αυτό δεν θα σταθώ εδώ αναλυτικά, μιας και το ερώτημα δεν είναι μικρό. Εάν θέλετε να αποφύγετε το δεύτερο πρόβλημα κατά τη χρήση αυτής της προσθήκης, διαβάστε το άρθρο που συνδέεται στην προηγούμενη παράγραφο. Εκεί περιγράφονται όλα με μεγάλη λεπτομέρεια, τι και πώς.

Το δεύτερο πρόσθετο που εμφανίζεται είναι το πακέτο seo Platinum. Αντιμετωπίζει τις σελίδες σελιδοποίησης με σεβασμό. Το μόνο πρόβλημα είναι η αντιγραφή του rel="canonical". Προβάλλοντας τον πηγαίο κώδικα της σελίδας, μπορείτε να δείτε ότι όταν είναι ενεργοποιημένη η λειτουργία προσθήκης χαρακτηριστικών, η τυπική έξοδος χαρακτηριστικών από τη μηχανή δεν καταργείται.


Κυκλοφόρησε ένα νέο βιβλίο, το Social Media Content Marketing: How to Get Inside Your Followers' Heads and Make Them Fall Fall with Your Brand.

Κανονική διεύθυνση URL - ένας βοηθός στην καταπολέμηση του διπλού περιεχομένου

Πολλά σύγχρονα CMS (συστήματα διαχείρισης περιεχομένου ιστότοπου) μπορούν να δημιουργήσουν . Αυτό οδηγεί στο γεγονός ότι μια σελίδα τοποθεσίας μπορεί να υπάρχει στο δίκτυο κάτω από δύο ή περισσότερες διαφορετικές διευθύνσεις. Οι μηχανές αναζήτησης έχουν αρνητική στάση απέναντι στο διπλότυπο περιεχόμενο και το μειώνουν στα αποτελέσματα αναζήτησης. Επομένως, ένα από τα κύρια καθήκοντα ενός webmaster είναι να απαλλαγεί από τις διπλότυπες σελίδες με κάθε δυνατό τρόπο.

Περισσότερα βίντεο στο κανάλι μας - μάθετε το διαδικτυακό μάρκετινγκ με τη SEMANTICA

Παράδειγμα διπλότυπου εγγράφου ιστού

Η αρχική σελίδα ενός πόρου Διαδικτύου είναι προσβάσιμη σε πολλές διευθύνσεις:

  • primer.ru
  • ru/index.php

Το ρομπότ αναζήτησης αναγνωρίζει αυτές τις διευθύνσεις ως τέσσερα διαφορετικά έγγραφα ιστού με το ίδιο περιεχόμενο.

Τι είναι μια κανονική διεύθυνση URL

Χαρακτηριστικό σας επιτρέπει να υποδείξετε στο ρομπότ αναζήτησης την κανονική, δηλαδή την κύρια έκδοση του εγγράφου. Αυτό το χαρακτηριστικό θα πρέπει να επισημαίνει όχι μόνο την κύρια προωθούμενη σελίδα του έργου Διαδικτύου, αλλά και τα διπλότυπά του. Εάν το ρομπότ βρει αντίγραφα μιας κανονικής σελίδας στον ιστότοπο, θα τα επισημάνει ως ασήμαντα. Η Canonical είναι η ευκολότερη μέθοδος αντιμετώπισης διπλού περιεχομένου.

Πώς λειτουργεί ένας κανονικός σύνδεσμος

Ας υποθέσουμε ότι έχουμε μια κύρια σελίδα http://yoursite.ru/statya1, η οποία μπορεί επίσης να βρεθεί σε πολλές άλλες διευθύνσεις:

Για να υποδείξετε την κανονική σελίδα στη μηχανή αναζήτησης, πρέπει να προσθέσετε την ακόλουθη γραμμή στον κώδικα καθενός από τα παραπάνω έγγραφα:

Αυτό το κομμάτι κώδικα πρέπει να τοποθετηθεί ανάμεσα στις ετικέτες . Αυτό θα αυξήσει τις πιθανότητες τα αποτελέσματα αναζήτησης να εμφανίζουν το κύριο έγγραφο και όχι τα διπλότυπά του. Θα πρέπει να σημειωθεί ότι το χαρακτηριστικό rel="canonical" λαμβάνεται υπόψη από τις περισσότερες σύγχρονες μηχανές αναζήτησης.

Γιατί το CMS δημιουργεί διπλότυπα;

Δεν πρέπει να υποθέσετε ότι το σύστημα διαχείρισης περιεχομένου δημιουργεί σκόπιμα διπλότυπες σελίδες. Συνήθως, τέτοια αντίγραφα δημιουργούνται λόγω εσφαλμένης διαμόρφωσης CMS. Οι πιο συνηθισμένοι λόγοι για διπλότυπα περιλαμβάνουν:

  1. δημιουργία αρχείων από παλιά άρθρα.
  2. διαθεσιμότητα ανοιχτών συνδέσμων σε έγγραφα σε εκδόσεις PDF (για εκτύπωση).
  3. εσφαλμένη δομή του ιστότοπου, προσθέτοντας πανομοιότυπες σελίδες σε διαφορετικές κατηγορίες.
  4. την παρουσία δυναμικών διευθύνσεων URL (συνήθης για ηλεκτρονικά καταστήματα).

Για να αναγνωρίσετε διπλότυπες σελίδες και να χρησιμοποιήσετε το χαρακτηριστικό rel canonical, μπορείτε να χρησιμοποιήσετε τα Εργαλεία για Webmasters Google. Πρέπει να μεταβείτε στην καρτέλα "προβολή αναζήτησης" και να κάνετε κλικ στον σύνδεσμο "Βελτιστοποίηση Html". Η ενότητα που ανοίγει εμφανίζει σελίδες με επαναλαμβανόμενες μετα-περιγραφές. Τέτοια έγγραφα έχουν συχνά διπλό περιεχόμενο.

Το Google PS συμβουλεύει να μην προσδιορίσετε το χαρακτηριστικό rel="canonical" ως οδηγία για το robots.txt. Αυτό μπορεί να προκαλέσει προβλήματα με την ευρετηρίαση ιστότοπου. Δεν μπορείτε να καθορίσετε διαφορετικές κανονικές διευθύνσεις URL για μια σελίδα (για παράδειγμα, μια διεύθυνση URL στον χάρτη ιστότοπου και μια άλλη απευθείας στην ενότητα σελίδες).

Για να μειώσετε την πιθανότητα σφαλμάτων κατά την ευρετηρίαση ενός ιστότοπου, θα πρέπει να καθορίσετε απόλυτες και όχι σχετικές διαδρομές ως το χαρακτηριστικό link rel. Με άλλα λόγια, αντί για τη δομή /blog/page-1, πρέπει να χρησιμοποιήσετε την πλήρη διεύθυνση http://yoursite/blog/page-1.

Σε αυτό το άρθρο θα εξετάσουμε τους κανονικούς συνδέσμους σε html (ιδιότητα rel="canonical"). Ας μιλήσουμε γιατί εισήχθησαν και σε τι να τα χρησιμοποιήσουμε. Θα πω αμέσως ότι εμφανίστηκαν το 2009 στη Google.

Τι είναι ο κανονικός σύνδεσμος

Διπλότυπα στον ιστότοπο - σελίδες που περιέχουν το ίδιο περιεχόμενο, αλλά έχουν διαφορετικές διευθύνσεις URL.

Τις περισσότερες φορές, τα αντίγραφα προκύπτουν ως αποτέλεσμα ελαττωμάτων στη μηχανή του ιστότοπου. Σχεδόν κάθε ιστότοπος που χρησιμοποιεί CMS έχει τέτοια προβλήματα. Δεν υπάρχει τίποτα κακό με αυτό εάν τα χειριστείτε σωστά. Είναι απαραίτητο να καταπολεμήσετε τα διπλότυπα, πρώτα απ 'όλα, για να κατατάξετε καλά στα αποτελέσματα αναζήτησης. Όπως γνωρίζετε, τα διπλότυπα επηρεάζουν αρνητικά την εμπιστοσύνη του ιστότοπου στο σύνολό του, άρα και τη θέση του.

Υπάρχουν διάφοροι τρόποι αντιμετώπισης των διπλότυπων:

  • robots.txt (όλα για το robots.txt)
  • 301 ανακατεύθυνση (πώς να κάνετε μια ανακατεύθυνση 301)
  • Σελίδα 404 (σφάλμα 404 - πώς να το ρυθμίσετε σωστά)

Ωστόσο, υπάρχει ένας τέταρτος τρόπος για να λυθεί αυτό το πρόβλημα - χρησιμοποιώντας το χαρακτηριστικό rel="canonical".

Το χαρακτηριστικό rel="canonical" - πώς να το χρησιμοποιήσετε

Σύνταξη rel="κανονική"
... ...

Αυτό το χαρακτηριστικό είναι γραμμένο σε ετικέτες κεφαλίδας . Σε όλες τις πανομοιότυπες σελίδες (διπλότυπα) πρέπει να αναφέρετε τη διεύθυνση της κύριας σελίδας (κύριας). Οι σύνδεσμοι σε href="" είναι κανονικοί σύνδεσμοι.

Για παράδειγμα, εάν ο ιστότοπος έχει πανομοιότυπες σελίδες

site/catalog/tovar site/catalog/tovar?sort=abc site/catalog/tovar?sort=price

Για να διευκρινίσετε ποια από αυτές τις σελίδες είναι η κύρια, απλώς γράψτε σε κάθε σελίδα:

Δείχνει έτσι στη μηχανή αναζήτησης ότι η διεύθυνση της κύριας σελίδας είναι site/catalog/tovar.

Απαντήσεις σε συχνές ερωτήσεις

1. Πρέπει να χρησιμοποιείτε κανονικούς συνδέσμους;

Ναι, αξίζει τον κόπο. Στο εξεταζόμενο παράδειγμα, ήταν δυνατή η χρήση μόνο κανονικών συνδέσμων ή robots.txt. Μπορείτε να συνδυάσετε αυτές τις δύο μεθόδους.

Όταν το χρησιμοποιείτε, πρέπει να προσέχετε να μην δίνετε στο ρομπότ ψευδείς συστάσεις σε εκείνες τις σελίδες όπου αυτό δεν είναι απαραίτητο.

2. Τι συμβαίνει εάν κανονικά οι σύνδεσμοι έρχονται σε αντίθεση μεταξύ τους;

Αυτό είναι κακό, αλλά το ρομπότ αναζήτησης στη συνέχεια θα καταλάβει μόνο του ποια σελίδα θα αφήσει ως κύρια. Είναι καλύτερα να αποφύγετε τέτοιες αντιφάσεις.

3. Περιπτώσεις που το ρομπότ μπορεί να αγνοήσει τις συστάσεις σας

Από τη βοήθεια του Yandex:

  • Το έγγραφο στην κανονική διεύθυνση δεν είναι διαθέσιμο για ευρετηρίαση
  • Η κανονική διεύθυνση είναι μια διεύθυνση URL σε άλλο τομέα ή υποτομέα
  • Έχετε καθορίσει πολλές κανονικές διευθύνσεις
4. Είναι δυνατή η χρήση μιας αλυσίδας κανονικών διευθύνσεων URL

Για παράδειγμα, το /stranica/123 συνδέεται με το /stranica/12 και αυτό με τη σειρά του συνδέεται με το /stranica/. Ένα ρομπότ αναζήτησης μπορεί να αγνοήσει ένα τέτοιο σχέδιο.

5. Πώς να επιλέξετε τη σωστή κανονική διεύθυνση URL

Είναι δύσκολο να απαντήσετε και να εξετάσετε όλες τις επιλογές σε μερικές προτάσεις. Ας δώσουμε γενικές συστάσεις. Κατά τη γνώμη μου, πρέπει να εξετάσετε την ελκυστικότητα της διεύθυνσης URL (ή ακριβέστερα, του CNC). Για παράδειγμα, εάν υπάρχει μια σελίδα /cat/2323fdfds34.html και μια σελίδα /cat/rel-canonical. Προφανώς, η δεύτερη διεύθυνση είναι πολύ προτιμότερη.

Εάν όλα δεν είναι τόσο προφανή, τότε θα πρέπει να επιλέξετε λιγότερα ένθετα άρθρα σε καταλόγους και μικρότερες διευθύνσεις URL. Για παράδειγμα, το /cat/podcat/podpodcat/str.html αντικαθίσταται καλύτερα από το /cat/str.html

Και το τελευταίο πράγμα: εάν κάποια σελίδα υπάρχει εδώ και πολύ καιρό και έχει καλή κατάταξη, τότε είναι καλύτερο να συνδέσετε όλα τα νέα "διπλότυπα" σε αυτήν. Η αλλαγή της διεύθυνσης κατά rel canonical, φυσικά, δεν πρέπει να επηρεάσει τις θέσεις, αλλά είναι καλύτερο να μην το ρισκάρετε εάν είναι ήδη ψηλά για αυτό το αίτημα.

6. Είναι δυνατή η σύνδεση σε άλλο τομέα με κανονική σύνδεση;

Το χαρακτηριστικό rel canonical μπορεί να χρησιμοποιεί μόνο συνδέσμους εντός τομέα ή υποτομέων. Δεν μπορείτε να συνδεθείτε σε εξωτερικούς ιστότοπους.

7. Είναι δυνατόν να κάνετε το rel κανονικό για τον εαυτό σας;

Ναι μπορείς. Δεν έχει νόημα αυτό, αλλά είναι επίσης κακό.

Μπορεί να υπάρχουν πολλοί λόγοι για διπλό περιεχόμενο: λειτουργίες CMS ιστότοπου, σελίδες με δυναμικές παραμέτρους URL, ο ιστότοπος είναι προσβάσιμος μέσω https://www.site.com/και από https://site.com/, http://site.com/και ούτω καθεξής. Εάν δεν υποδείξετε στη μηχανή αναζήτησης τη σελίδα προτεραιότητας - την κανονική σελίδα με διπλό περιεχόμενο, το ρομπότ θα την επιλέξει κατά την κρίση του και οι συνέπειες μπορεί να είναι δυσάρεστες, ειδικά για τους ιδιοκτήτες ιστότοπων.

Σελίδες με ετικέτες UTM

Είναι απαραίτητο να ρυθμίσετε τις παραμέτρους του διακομιστή έτσι ώστε όταν βρεθούν παράμετροι UTM στη διεύθυνση της σελίδας, να επιστρέφεται ο κωδικός "200 OK" και η σελίδα να περιέχει έναν απόλυτο κανονικό σύνδεσμο προς τη διεύθυνση URL αυτής της σελίδας χωρίς ετικέτα UTM.

Μιλάμε για τις ακόλουθες παραμέτρους UTM:

  • gclid;
  • utm_medium;
  • utm_source;
  • utm_campaign;
  • utm_content;
  • utm_term;
  • _openstat.

Λοιπόν, η σελίδα " http://site.com/?utm_source=testk&utm_medium=test&utm_campaign=test" πρέπει να περιέχει έναν κανονικό σύνδεσμο: .

Φιλτράρισμα σελίδων

Στις σελίδες φιλτραρίσματος, οι ίδιες οι σελίδες φιλτραρίσματος θα πρέπει να ορίζονται ως κανονικές.

Για παράδειγμα, για τη σελίδα " http://site.com/category-1/filter-1/» απαιτείται σύνδεσμος: .

Μερικές φορές κατά τη μετάβαση σε ένα νέο όνομα τομέα, χρησιμοποιείται ένας διακομιστής που δεν υποστηρίζει ανακατευθύνσεις από την πλευρά του. Σε αυτήν την περίπτωση, μπορείτε να χρησιμοποιήσετε το χαρακτηριστικό μεταξύ τομέων rel="canonical" στο στοιχείο σύνδεσης.

Σημαντικό: προς το παρόν, μόνο η Google κατανοεί την κανονική μεταξύ τομέων.

Τι πρέπει να θυμάστε όταν ρυθμίζετε το rel="canonical";

  1. Οι σύνδεσμοι στο χαρακτηριστικό πρέπει να είναι απόλυτοι - από http:// ή https://. Αυτό μειώνει τον κίνδυνο σφαλμάτων.
  2. Εάν υποδείξετε μια άλλη σελίδα ως κανονική σε μια σελίδα με διπλό περιεχόμενο, φροντίστε να το κάνετε Αυτή η σελίδα θα πρέπει επίσης να καταχωρηθεί ως κανονική.
  3. Εάν υπάρχουν πολλές κανονικές διευθύνσεις σε μια σελίδα, το ρομπότ αναζήτησης θα τις αγνοήσει και θα καθορίσει την κανονική σελίδα από μόνο του.
  4. Εάν μια σελίδα που επιστρέφει έναν κωδικό απόκρισης 404 έχει καθοριστεί ως κανονική, το ρομπότ αναζήτησης δεν θα μπορεί να χρησιμοποιήσει αυτήν την πρόταση.
  5. Για να αποφύγετε σφάλματα, δεν πρέπει να χρησιμοποιείτε αλυσίδες κανονικών σελίδων.
  6. Τα ρομπότ αναζήτησης αντιλαμβάνονται το χαρακτηριστικό rel="canonical" όχι ως αυστηρή οδηγία, αλλά ως σύσταση, δηλαδή, η καθορισμένη διεύθυνση URL μπορεί να αγνοηθεί.
  7. Κατά τον ανεξάρτητο προσδιορισμό κανονικών σελίδων, η μηχανή αναζήτησης Google προτιμά τις σελίδες στο https.

συμπεράσματα

Στην πρακτική μας, υπήρξαν περιπτώσεις όπου περιεχόμενο από έναν ιστότοπο αντιγράφηκε στο σύνολό του, μαζί με εσωτερικούς συνδέσμους κειμένου και κανονικές διευθύνσεις. Επομένως, το χαρακτηριστικό rel="canonical" θα πρέπει να προσδιορίζεται σε όλες τις σελίδες.

Είναι ιδιαίτερα σημαντικό να προσδιοριστεί η κανονικότητα για:

  • σελίδες σελιδοποίησης?
  • σελίδες με ετικέτες UTM.
  • φιλτράρισμα σελίδων.

Αυτό βοηθά στην καταπολέμηση του διπλού περιεχομένου και στην προστασία του ιστότοπου από αντιγραφή.