Web 2.0 analytics: time spent

 


After analyzing the impact of web 2.0 on the concept of unique visitor, I continue my tour of web 2.0 measurement metrics.


 


Time has become the scarce resource on the Internet. Everyone is trying to win the largest share of the cake: the time of the user. This time, is taken over the other media (television mostly). But the war between the sites has been hard, trying to get a piece of their visitors’ attention.


 


Web 2.0 has given time a central role. We can no longer be satisfied with the old way of measuring it. There used to be two methods so far: the panels (user-centric tools) and the site-centric tools.


 


In panels measurement (it was our former job), you install a software on the computer of volunteering Internet users. When the software is installed, possibilities are unlimited. We could therefore refine the measurement of time taking into account:


- is the page visible (not hidden behind another application for instance)


- is the panelist actively using the computer?


 


This has allowed us to provide a simple and complete definition of the time spent on a page: period during which the page can be viewed and the user is active.


 


At that time (we are talking about a century ago in 2005), the tools installed on sites were computing time in a much less robust way. The time spent on a page was got by measuring the time difference between this page and the following page.


 


Whether the user has immediately gone back (to another site), or if he has gone a few minutes (for any natural need), or he switched to Excel to his accounting, none of this was taken into account. There were many ways to correct time of a page in post-treatments (less than 30 minutes, or according to the mean and standard deviation of the page duration). But it would never be perfect. This measure was always overestimated, and worse, nobody was even able to know by how much it was overestimated.


 


When we (Nicolas and I) have moved from user-centric to site-centric tools, we found it would hurt our feelings too much to do less than what we had been doing before.


 


But with the Web 2.0, came Web 2.0 technologies. And our technological developments allow us to keep the same definition for our site-centric tool as we used to have in our user-centric one.


The only difference is that we deal with contents, not pages (I will make a article on the notion of content, but you should just know that, in many cases, a content is almost equivalent to the page in which it is displayed).


 


So: time spent on a content is the period during which the contents is visible and the user is active.


 


When you have a reliable definition of the concept of time, and when tools like ours can accurately measure the actual time spent, time can become a central indicator of web 2.0.


 


Why hasn’t it be true, so far? Because advertisements are bought by page views, which can be measured by the tools, while these tools always overestimate the time spent.


 


 


Time will really have won the day when advertising will be bought according to the total time spent on the site (see article in French).


 


And you can check it by yourself, on our demo page, that time is now a reliable metrics.

 

L'impact de l'iPhone sur la mesure d'audience

L'iPhone n'est pas qu'un gadget. Il a un réel impact sur l'internet mobile. La preuve avec cet article de TechCrunch (en anglais)/


 


Pour résumer, on y apprend que les utilisateurs d'iPhones voient 22 fois plus de pages web que les utilisateurs de téléphones sur Windows Mobile. Et ne parlons même pas des autres types de téléphone.


 


A quoi est du ce succès ?


- la taille de l'écran (et donc l'absence de clavier, décision si gonflée et courageuse)


- la prise en compte du javascript et du css (qui rendent enfin possible l'affichage de tous les sites (sauf ceux en flash pour l'instant))


- la possibilité de zoomer sur une page (et sans passer par un menu, évidemment)


 


Même si certains (comme Google) refont leur site spécifiquement pour l'iPhone, c'est la presque totalité du web qui devient accessible depuis votre téléphone mobile. Et ça change tout par rapport aux offres hyper-limitées de sites accessibles uniquement pour faire gonfler la note de votre forfait...


 


Si le javascript fonctionne sur iPhone, pourquoi y aurait-il un impact sur la mesure d'audience (les outils site-centric utilisent le javascript, donc tout rentrerait tout seul dans l'ordre) ?


 


C'est la troisième caractéristique de l'iPhone, la fonction de zoom qui change beaucoup de choses. Le fait de pouvoir zoomer sur un article, un commentaire, une photo, etc. prouve que la mesure d'audience au niveau d'une page complète est une notion périmée.


 


Sur un iPhone, vous vous déplacez en permanence sur une page, vous zoomez, cliquez, dézoomez... Les bannières publicitaires (sources de revenus de nombreux sites) ne sont donc pas visibles la plupart du temps. Et ça, les annonceurs y font très attention. Pourquoi payer un affichage de publicité qui ne sera pas vue ?


 


L'analyse de l'audience d'un site doit s'adapter à cette nouvelle manière de consommer des contenus. Les gestionnaires de sites doivent savoir ce qui est réellement lu sur leurs pages. Ils ont déjà abandonné les sites "mono-écran" (sans barre de défilement verticale), trop contraignants. Avec l'iPhone, la page la plus simple est déjà plus grande que l'écran.


 


Pourtant, il est possible de mesurer ce qui est réellement lu. Nous vous l'avons montré depuis des semaines sur notre page de démonstration de mesure d'audience 2.0.


 


Très bientôt, cette même démonstration fonctionnera sur iPhone. Notre système sera donc capable de savoir quelle zone d'une page l'utilisateur est en train de lire sur son iPhone.


 


Pas mal d'applications possibles (optimisation ergonomique, bannières publicitaires mobiles, rétribution des auteurs, que sais-je ?), non ?


 


 

Web 2.0 analytics: unique visitors

The Web 2.0 does not change the definition of what a unique visitor should be. It just bring new possibilities to get closer to this definition.


 


The holy grail of unique visitors is the possibility of recognizing the same individual. There are two notions in the concept of unique visitor:


* It is a human being (as opposed to a computer program)


* In spite of various aspects, it remains unique.


 


One of my favorite philosophers, Clement Rosset, wrote in "Le Réel, traité de l’idiotie” (“The Real, treaty of idiocy”): “idiotès, stupid, means simple, unique." According to him, everything that is real is by definition single, idiot. Let's therefore call the unreachable ontologically unique visitor, an "idiot visitor". :-)


End of the philosophical parenthesis ...


 


If the “idiot visitor” is beyond the reach of technology, we can satisfy ourselves with the unique visitor. And one definition, using the two above points, could be:


* Detect that the content is viewed by a human being


* And recognize the same person from one content to another.


 


None of this has changed with the arrival of Web 2.0. But what has changed is the technical capacity that is offered to improve the implementation of this definitions.


 


The robots who aspire pages attempt to act as humans. The audience measurement systems must therefore do their utmost to automatically remove the pages served to robots.


The use of advanced scripts, such as those that we have developed, can surely detect the presence of a human being behind the screen.


 


Of course, the robots will try to improve, and one day they may circumvent the system as it is deployed today. But it will take them an increasingly important amount of resources, and we can easily set the bar a little higher.


In this race to technology, the goal is not to find an unlikely unbreakable method, but to make piracy more expensive than the benefit.


 


That’s how to get rid of most non-human visitors.


 


For the other dimension, that of "recognize" a visitor, analytic tools usually put cookies (a small file stored on your hard-drive by your browser).


Again, there is a danger of counting too many visitors, by counting several times the same visitor if his cookie cannot be retrieved. That happens:


 


* If he uses multiple computers


* If he uses multiple browsers


* If he delete its cookies


* If a software deletes them for him.


 


In each of these cases, the effect is the same: the number of unique visitors is overestimated.


 


Conversely, if several people share the same computer, there may be one cookie for several idiots, sorry, unique individuals.


 


We are not going to tell you that our technology makes it possible to detect the idiot visitor. But we have the ability to dramatically improve the problem of cookies.


 


All visitors to the sites that use our system can create an Alenty account. This account is used as a reference for us to count them as a unique visitor.


Thus, on a single computer, two users identified with their Alenty account are counted as two different visitors!


On the other hand, a user who is identified on a computer s ithat different from the one he used earlier is counted only once!


 


The standard audience measurement tools do not have this capability. Why?
Because the user has no interest to identify himself. But if he has something to gain, he may do it.


 


Everyone will not create an Alenty account. But all those who do will contribute to improve the accuracy of our measure.


 


And a part of our job is to find the right ways to motivate people to identify themselves.


 


It will even be more accurate when we gather the identification from the website itself...


 


To be continued…

 

Comment mesurer l'efficacité d'une commuauté

L'internet communautaire s'est développé pour deux raisons :


- le narcissisme


- la flemme


 


Le côté narcissique, c'est juste l'envie de s'exprimer que j'ai déjà abordée. Les lecteurs sont narcissiques, ils veulent laisser une trace.


 


La flemme touche les webmasters. Ils veulent avoir la meilleure audience pour le moins d'effort possible. Et lorsque vous placez un narcissique et un flemmard face à face, ils s'associent et tout le monde est content !


 


Ce qui coûte des efforts dans un site communautaire, c'est d'apporter des contenus intéressants. Les lecteurs d'un blog viennent chercher des informations qu'ils ne trouvent pas ailleurs. Or, croyez-moi, ça demande des efforts de pondre des articles tous les deux ou trois jours (et maintenant en anglais aussi !).


 


Or, on constate que certains visiteurs lisent les commentaires. Si, si, croyez-moi ! On sait très bien mesurer qui lit les commentaires de ce blog, on vous montre même comment on fait !


 


Il y a donc des visiteurs qui passent du temps sur mon site, à lire des contenus que je n'ai pas sué sang et eau à écrire ! Pour quelqu'un d'aussi flemmard que moi, c'est royal !


 


Qu'est-ce que l'efficacité d'une communauté, alors ?


 


*C'est la part du temps passé sur des contenus apportés par la communauté.*


 


Un site à l'ancienne, où l'on ne peut pas s'exprimer, a une efficacité communautaire nulle.


 


Inversement, Facebook fait générer tous ses contenus par ses membres (pire encore dans leurs cas, ils ne développent même pas les applications de leur site !). Ils ont donc une efficacité communautaire maximale.


 


Pour un blog, l'efficacité communautaire varie en fonction des sujets abordés et du dynamisme de la communauté.


 


Je ne me risquerai pas à vous donner des recettes infaillibles pour améliorer votre efficacité communautaire. L'animation et la ligne éditoriale de votre blog ne dépendent que de vous.


 


Mais si vous pouvez mesurer ce qui marche et ce qui ne marche pas, vous aurez les informations nécessaires pour prendre les bonnes décisions.


 


Who's Hot mesure l'efficacité de votre communauté, et vous aide même à la renforcer (en mettant en avant les contributeurs les plus efficaces).


 


Vous l'avez compris, lire vos commentaires entretient ma flemme, alors vous n'avez plus le choix, commentez !

 

Web 2.0 analytics (or audience 2.0)

Let me reduce the concept of “web 2.0” to its two main dimensions:


- Technology (also called Ajax) that improve the usability of websites


- The exchange of information among all Internet users (the community aspect).


 


These two dimensions have little connection between them: the exchange of information can be based on Web 1.0 technologies (blogs rarely use advanced ajax), but these technologies have been so simplified that they are no more reserved for an elite.


 


But these two dimensions have obliged the Internet industry to rethink the very notion of audience (or analytics), and the indicators used to measure it.


 


I have already talked a lot about these concepts audience that are now obsolete:


- The end of page views


- More page views, so what


 


In order to set up the definitions, I made a tour of the extent of


the existing audience 1.0 concepts:


- The visits


- Unique Visitors


- Time


 


It is easy to criticize, so let me now propose something instead.


 


The concepts that define the web 2.0 analytics (or analytics 2.0) are ready. The technology also. In the coming days, I will show you what could be (and, trust me, what will be) the web 2.0 analytics.


 


This will imply by a redefinition or change in the notions of visits, unique visitors and time.


 


But the web 2.0 analytics must go further and address the issue of information exchange (communities aspects of web 2.0). We will therefore look at what are the indicators that can reflect the commitment and the efficiency of a community.


 


Stay connected!


 


 

Audience : time spent

Let me summarize the basic indicators of a website’s audience on three independent axes:


- The number of visitors


- The frequency of visits


- The time spent per visit


 


I have already mentioned the visitors, frequency. So, time spent is the last indicator to analyze (before attacking one on the web 2.0 analytics).


 


Why say so peremptorily that these three indicators may be enough to analyze the audience of a site?


 


You may think that I am monomaniac because I have already talked a lot of time : The GRP of the Internet (in French) or time for the user.


 


The recent decision by Nielsen to provide the total number of minutes spent on a site (in millions) proves one thing: the total time is the most correlated to the value of a site.


 


Based on a rough approximation, one can even say that the time is the equivalent of turnover. It's a rough approximation (the relationship between the turnover and the time depends on the economic model of each site, but for identical models, the analogy works), but let me use it a little ...


 


In the world of marketing studies of consumer markets, the products managers regularly receive the results of Nielsen (again!) or IRI panels. Any good product manager has only one thing in mind: maximize the sales of his brand.


 


And how does he split turnover?


He looks at the number of buyers, the frequency of purchases and the average basket value.


 


Why do we use this split?


 


Because these indicators are independent of each other.


You can increase the number of visitors, without affecting the frequency of purchases or the basket: by bombarding advertising targeted to attract new buyers.


You can increase the frequency of visits: by targeting advertising on those who are already customers to bring them back.


You can increase the basket: by conducting on-site promotions.


 


These three indicators also have the good idea to recreate the turnover when multiplied: turnover = Buyers x frequency x average basket.


 


On the Internet, the total number of minutes can be split in the same way:


Total minutes = unique visitors x frequency of visits x time spent per visit.


 


When analyzed this way, web analytics becomes very simple. Just apply the same rules as in the consumer goods and play, when appropriate, on each of the three indicators. Reread the above example by replacing the words associated with purchases by those of the Internet, and you will see.


 


If it is so important, can time spent be measured as accurately as the value of the basket?


 


Yes, time can be measured with the required precision.


 


Both in “user-centric”, or in some "site-centric" tools such as ours, time is measured exactly.


 


Details of the measure will come later, but I will conclude by giving the definition that is used to calculate the time spent on textual contents (there are small differences for the video and audio contents):


period during which the contents are visible by a user actively using the computer.


 


Don't you think that this definition is better than the ones usually used?

 

Audience 2.0 : mesurer les sites en Ajax

Le web 2.0 a deux caractéristiques principales : les échanges communautaires et les technologies AJAX.


 


Acronyme de (Asynchronous Javascript And XML), l'AJAX est simplement une technologie qui permet de modifier une partie d'une page web sans avoir besoin de la recharger complètement.


 


L'AJAX permet donc d'améliorer considérablement l'ergonomie des sites. Ils deviennent plus rapides à utiliser, plus agréables, plus ergonomiques.


Mais l'AJAX pose aussi des problèmes pour le référencement et la mesure. Les moteurs de recherche n'arrivent pas à récupérer le contenu des parties dynamiques des pages. Nous ne sommes pas spécialistes de SEO (Search Engine Optimisation), et je ne m'apesantirai pas sur ce sujet.


Pour la mesure du comportement des utilisateurs, l'AJAX pose aussi problème.


 


Pour commencer, notez que je viens de parler d'"utilisateurs" et non de visiteurs. C'est que les sites en AJAX sont utilisés autant qu'ils sont lus.


 


Et comme la lecture était souvent associée à la notion de pages, l'AJAX achève le concept moribond de pages vues.


 


En effet, il est possible de créer des sites 100% AJAX, constitués d'une seule page ! NetVibes, Gmail sont d'excellents exemples.


 


Mesurer les pages de ces sites n'a donc aucun sens.


 


Que proposent les outils qui disent mesurer les sites en AJAX ?


Ils vous demandent simplement de faire le boulot à leur place...


 


Au d'autres termes, ils mettent à disposition une interface qui vous permet (enfin qui permet à vos développeurs) de les prévenir à chaque action utilisateur. A vous de décider quelles actions méritent d'être enregistrées.


 


Et surtout, à vous de vérifier que vos développeurs font bien leur travail ! Ou simplement qu'ils n'oublient pas l'appel à l'outil de mesure.


 


L'outil de mesure devient donc simplement un outil de "reporting", de présentation des résultats, puisque finalement, c'est vous qui faites la mesure.


 


Leur valeur ajoutée devient donc très questionnable. Ces outils ne sont plus des tiers certificateurs de votre audience ou du comportement de vos utilisateurs. En effet, vous pouvez, involontairement ou non, artificiellement augmenter les évènements enregistrés, ou en oublier certains.


 


La seule alternative à la page vue étant le temps passé, est-ce à vous de réfléchir à une méthodologie de mesure du temps passé ? Est-ce à vous (ou à vos développeurs, c'est peut-être pire) de vous poser des questions de ce type : je raffraichis automatiquement tel morceau de la page, est-ce que l'utilisateur est actif (auquel cas j'appelle l'outil de "mesure") ou non ?


 


Si vous voulez mesurer proprement votre site en AJAX, le temps passé par chaque utilisateur (ou visiteur) doit être mesuré de manière fiable et impartiale.


Donc pas par vous.


 


Quelle est l'aternative ?


 


C'est l'outil de mesure qui doit s'adapter au site et non l'inverse. L'outil doit en permanence surveiller la visibilité des éléments qui vous intéressent. Et enregistrer automatiquement ce qui est véritablement vu.


 


Sur notre page de démonstration de mesure d'audience, vous voyez que l'on sait quels sont les commentaires qui sont filtrés par le thermomètre. On aurait pu le faire comme les autres outils de mesure : le thermomètre dirait à l'outil de mesure quels sont les commentaires qui sont filtrés. Mais, vous pouvez me croire, nous ne trichons pas dans cette démonstration. C'est l'outil qui surveille les commentaires et détecte ceux qui sont visibles et ceux qui sont filtrés.


 


C'est pour cela que cette technologie peut être appliquée à tous types de sites sans nécessiter de développement du côté du site.


 


Ainsi l'outil de mesure garde toute sa valeur ajoutée :


- il ne dépend pas d'appels explicites écrits dans le code de votre site


- il vous soulage des questions méthodologiques comme l'activité de vos utilisateurs


- il vous fournit une mesure fiable et objective du temps passé


- il se place du point de vue de l'utilisateur et non du développeur.