TEMA: Entrevista con Dr. Mike Dobson, director de TeleMapics

Entrevista con Dr. Mike Dobson, director de TeleMapics 28 Jul 2011

  David Krause
  • Avatar de David Krause
  • Colaborador Anual
  • Mensajes: 1674
  • Gracias recibidas 365
  • Felicitaciones: 144
Dr. Mike Dobson, TeleMapics' Principal, offers his views on mapping, navigation and user-generated data. Dr. Mike Dobson discloses the problem with his experience of the authority system in Google's Map Maker; his views about the privacy debate surrounding the collation and storage of location-based and geo-location data; and he provides his top crowdsourcing, data collation and verification tips. Read all about these topics and more here...

1. Would you agree that letting users create new points of interests on maps creates problems, and why or why not?

Letting users of location-based services (LBS) create new points of interest (POI) on maps is an integral component of modern map compilation. Creating map, points of interest or business listings databases can benefit from the use of crowdsourcing to augment traditional map compilation and list building processes. It is fundamentally impossible for commercial firms who create these databases to produce maps with points-of-interest or points representing businesses or services that are always up-to-date, comprehensive or highly accurate. Some degree of reliance on users who are on the ground and capable of directly observing the location in question can be used to improve the quality of all databases used for LBS.
We are early in the stages of adopting and adapting crowdsourcing to fit the needs of our customers, but it is unlikely that any commercial data supplier who services the LBS market will not in some fundamental way embrace crowdsourcing. It is my opinion that our current abilities with regards to crowdsourcing are limited and do not allow us yet to take advantage of the potential benefits of crowdsourcing. While there will always be erroneous data related to those contributors who are gaming or spamming the system, the problem today appears to be that we have not engineered our crowdsourcing-based systems to accommodate and remediate these types of bias. Nor have we managed to optimize the methods used to solicit and evaluate local knowledge.

It is likely that open crowdsourced systems may not provide the level of accuracy and up-to-datedness that are desired by the majority of LBS users. Instead, a hybrid compilation approach that uses crowdsourced data for change detection purposes coupled with more traditional data compilation techniques will become, if it is not already, one of the core methods of gathering POI, business listing and map data used by all commercial firms in our industry.

2. How can mapping and LBS integrated navigation providers reduce any errors that will reduce the quality of their solutions?
Most companies rely on traditional data compilation techniques that normally include an ensemble of map data compilation tools, including field work/observation, data mining, use of imagery (satellite and road-side) conflation, data editing and rigorous quality control/quality assurance procedures. While errors in the past products were often the result of procedural mistakes in the compilation process or composition errors in the film creation process related to the printing, today we see errors of a different type.
In essence, many map and data attribute errors now appear to result from database synchronization problems, conflation, inadequate automated quality control systems and the over-reliance on sophisticated software tools that are not yet capable to solve the problems for which they were designed. The goal of industry should be to develop an expert system that might be able to remediate the major aspects of these errors, but we are very far from that solution.
Indeed, I regard Googles use of crowdsourcing to correct errors on their purpose built database of the United States marked their capitulation on the concept of removing humans from the compilation process. Taking humans out of the process is an understandable goal, since we are expensive, difficult to work with and idiosyncratic. However, I can think of no major navigation database provider that would not benefit from the keen eyes and intellect of an accomplished team of professionally trained map editors.
Crowdsourcing can be thought of as an attempt to provide these human map editors on-the-cheap and has the advantage that it can provide input from a large group of interested individuals. As noted above, crowdsourcing systems have not yet been developed to the level we need to dramatically improve the quality of map databases, but I expect this problem to be solved in the future.
The accuracy of LBS and navigation systems can be improved when people with local knowledge contribute accurate local data, as managed by an appropriately designed crowdsourced system. Further benefits to the quality of all data fused in an LBS solution can result from the analysis of crowdsourced and traditionally compiled data through its review by professionals trained in map compilation. Unfortunately, there are not many with these types of skills remaining in the workforce and the profession, having transformed from maps to Geographical Information Systems (GIS), may not have the capability or skills to train new ones.

3. With reference to your blog, what do mean when you suggest the winners will take a hybrid approach, and how does this apply to Navteq and Google?

As indicated in my response to Question 1, I am an advocate of mixing traditional compilation techniques (field work/observation), data mining, use of imagery (aerial, satellite, road-side), conflation, formal data editing/QC) with an appropriately configured crowdsourcing system used to solicit local knowledge about map errors, updates, and other augmentations (streets, POIs. Business listings, addresses and data attributes of various types (e.g. road furniture in the form of street signs, etc.).
Google and Navteq are interesting examples of the hybrid approach to map compilation. Navteq has a much more powerful and directed approach to field observation than Google. Conversely, Google has a much more powerful method of collecting crowdsourced data than Navteq.

Both companies have access to crowdsourced data in the form of Passive Crowdsourcing, which involves the tracking of the path cell phones or other GPS equipped devices as people travel through an environment. These data allow one to derive the geometry of a street, travel times, traffic flow and a variety of information, but these platforms do not provide information on street names, addresses or other attribute information that currently needs to be captured by observation of the environment, rather than inferences made by the processing of a path on a graph.

Conversely, Active Crowdsourcing relies on the good-will of a user who notes a map error or omission and decides to directly contribute information using an online system in a manner that might resolve the problem they observed while in the local area. Google Maps offers the user a variety of ways to resolve these problems, include the use of Google Map Maker.
Google benefits from the enormous number of people who seem to be willing to correct Google Maps and provide that information to Google without fee. Navteq largely relies on its Map Reporter, which does not generate significant traffic.

4. In what way does crowdsourcing enhance the value of the location-based services that they offer customers, and how can they ensure the points of interest are relevant to a particular individual?
Crowdsourcing enhances the value of location-based services by potentially increasing the number of points of interest in a database, as well as increasing their up-to-datedness and their comprehensiveness through the contribution of contact information, address, hours of service, other services offered, etc.
One key to the usefulness of a crowdsourced system is the number of people willing to contribute data, as mitigated by their intent, observation skills, and their spatial and temporal distribution. It is my belief that the user base of Google Maps is incredibly large and many of these users are willing to contribute data to improve the quality of the product. More contributors generally equate with increased accuracy of crowdsourced data, as a result of more eyes seeing and evaluating the same problem, as well as the probability that more eyes will discover and remediate other map or database problems.
The essential practice in crowdsourcing is that the system focuses on attracting local users who can contribute information about problems with maps in the areas where they live, work, shop and play. These potential contributors to crowdsourcing systems are the ones who know which shops are actually in business, where they are, the hours they are open for business and when they have gone out of business. Every company trying to gather these data is relying on some form of surrogate measurement that may take months or even years to percolate its way through the compilation process and into their database, not to mention the amount of time it will take for these data to be distributed and subsequently displayed in location-based systems.
Crowdsourcing is one way of short-circuiting this path and bringing new or up-to-date information to these databases in a very short period of time. Traditional map or list building compilation techniques do not provide this type of benefit, although they do provide a baseline for augmentation by crowdsourcing techniques.
Assuring that crowdsourced points of interest are relevant to a particular customer can be attempted in a variety of ways, but a fusion of several techniques is required for success. It is my opinion the crowdsourced systems cannot be open and meet the needs of commercial data suppliers for quality products. Instead, the commercially crowdsourced system must have structure in terms of what can and cannot be edited, including the use categories of data that can be contributed. While this is restrictive for the contributor and takes some getting used to, it is required if the database provider is to make sense of crowdsourced data inputs.
Next, it is imperative that the provider of the location-based service mine the click stream of the user to determine what was being searched for in which geographical location. The provider needs to have an understanding of what the user was or might have been searching for by location, as well as some type of evidence that they found or did not find that for which they were looking. Using advanced techniques the provider can gain an understanding of the success of POIs in meeting the requirements of users for search and location, particularly if that user is on a mobile device and travels to or near the location of the POI.
Evaluating the fabric of search behavior allows the provider to rate POIs, contributors of POIs, the spatial efficacy of their POI database and a number of factors that can be used to identify areas that need to be updated, perhaps by traditional compilation efforts.

5. Why do smaller customers demand less attention, and conversely why do larger ones demand more of it?
Smaller customers usually do not have the time to effectively market their business, since these proprietors spend most of their time actually operating their shop or service. Even in the days of Yellow Pages and classified ads, these are the companies that would not advertise unless someone walked into their shop and made it easy of them to do so. In the age of the Internet, these companies demand less attention, because the distribution mechanism of the Internet largely ignores them, as they are in the long tail and, for a variety of reasons, may not be aggregated with any significant benefit.

While Google and others provide services that allow small business owners to claim their business, how many small business owners have time to do this at Google, Bing, Yahoo, infoUSA (now Infogroup) and other services? Yes, there are consolidators who provide these types of services for small business owners, but do these people ever walk into the small business owners shop and solicit their business, as opposed to the proprietors seeing the guy from the Yellow Pages who brings a book with their business listing in it? What would it mean to any of these people if they meet the search evangelist from Strategic Search Services of Sussex and how would they understand any benefits that this company might provide?
Larger customers demand more attention because they have buying power. Often, these companies are in the elite customer segment of those having entered contracts with significant revenues that benefit the vendor partner. In addition, larger customers are often more concerned about their brand and have brands that are known across market areas of significant size.
These companies often have marketing and corporate identification teams focused on advantaging and protecting the status of their brand. For example, data providers who do not have the location of a major advertising partners company outlets correctly located and posted with the correct contact information and hours of operations are in for a troubling period. Conversely, the owner of the individual shop may never even know that you have mislocated her enterprise or where you actually have managed to publish the listing online.

6. What was the problem with your experience with the authority system in Google Map Maker; and for the uninitiated, what is it?
Map Maker is an application developed by Google to let people create and update maps based on digitizing the transportation network (mainly streets and roads) from the imagery (satellite or aerial) Google publishes for this purpose. In addition, the system allows users with local knowledge to augment these data through the addition of relevant details that cannot be derived from the imagery, such as road numbers, street names, addresses, current points of interest, etc. Initially, Map Maker was available mainly to users in countries where Google was unable to provide a detailed, current base map.
To some degree the targets for Map Maker were the countries not provided to Google, at that time, by their map database suppliers Tele Atlas and Navteq. In addition, some geographical areas where Map Maker was offered had excellent government-produced base maps, but due to copyright restrictions on their use and the high cost of licensing these were generally not available for public use.
More recently, Google decided to use Map Maker as one of the editing/correction options for users of the Google Map base in the United States, a map database that Google built independently of Tele Atlas and Navteq.
In essence, the edits and updates that users suggest be made to the Google Map of the U.S. are crowdsourced through the use of the Google Map Maker System, which allows one to edit streets, road, points of interest and other select data, as allowed by Google. Based on my experience using Google Map Maker, it appears that although you can submit changes for streets, roads and addresses, you cannot directly edit specific aspects of road geometry, nor can you alter or provide boundary information for states, counties, towns, villages, zip codes or other displayed geographical areas.
True crowdsourced systems rely on the crowd to evaluate and re-edit map alterations when it is believed that these contributions are erroneous. For example, MapQuest, in its use of OSM data for some of the navigation websites it publishes, provides some types of updates that are made to the master OSM database to its instance of the database in a matter of minutes, although even the more complex types of data that require additional processing (e.g. those related to routing attributes) may be posted in less than a day. One reason for the need for speed in these types of systems is that the sooner others see the data, the sooner it can be corrected if erroneous. Google, however, has taken a different approach.
Currently in Map Maker edits for the Google Maps U.S. map base contributions made by users are submitted through Map Maker and evaluated by Google employees. These people, called trusted map reviewers by Google, have the authority to accept, reject, correct or simply ignore the contributions made by users.
The accuracy of a crowdsourced system is based on the concept of local input from local users who have observed the location in question. Map Editors who are tasked with evaluating this input should have at least the same familiarity with local ground truth, or they will find it difficult to effectively evaluate the input provided by the user. Unfortunately, at least as of a month ago, these trusted map reviewers were not based in the United States, nor is there any reason to believe that these editors were familiar with any of the geography related to the contributions they were evaluating. Further, it appears that their expertise in mapping is limited to their familiarity with the Google Map Maker Tool.
The process on which the Google trusted map reviewers base judging whether corrections are correct or not appears to be rely on whether the correction is identifiable, reasonable or logical based on an examination of the Google imagery for the area (both satellite and Street View if available), but the process does not appear to use any other data, including local knowledge.
Those of you who have spent any amount of time with the Google Maps imagery base may have observed that it is not always, quite understandably, up-to-date. For this reason its effectiveness can be considered limited in terms of the resolving issues that postdate the imagery collection, which, to be clear, is rarely identified by copyright date provided on the image. In addition, imagery can be of limited help in attempting to understand changes in POI status, or deriving attribute information useful for navigation.
If you take the time to examine the terms of service for moderating Google Map Maker corrections, you will find this statement You agree and undertake that the underlying intention behind moderating User Submissions is to remove any submission that you know through your personal local knowledge either or inappropriate or factually incorrect and to approve such User Submissions that to your personal knowledge are accurate. Of course these are the rules for users using Map Maker in countries where they are allowed to evaluate the contributions of their peers.
Curiously, however, in the United States, the use of Map Maker to edit the Google Maps United States product is conducted by a team that, although very pleasant, has absolutely no local knowledge about the geography pinpointed in the contributions they evaluate. From my perspective, the process as currently engineered is disconnected from some of the potential strengths of appropriately engineered systems that use crowdsourcing as a method of compiling map, point of interest and business listing data. For those interested in a more in-depth analysis of this issue, see my two part blog on Google Map Maker at

7. What are your views about the Federal Communications Commissions opinions about privacy and location-based services?
Privacy is a delicate issue for location-based services, but one that needs be understood and evaluated in respect to the wants of its user community. From a service standpoint, users unwilling to release a location to a provider of LBS services will be unable to use the service in a seamless, practical manner. However, it is my opinion that users need to decide this question for themselves, based on their evaluation of the risks and rewards.
However, I do agree that there needs to be a carve-out for users of less than certain ages, to prohibit their being preyed upon by others or consuming services not designed or perhaps illegal for the age group. However, my consulting practice is not focused on the privacy issues and I have do not have any particularly insightful ideas on how privacy can be implemented and preserved in location-based systems.
I will say that even the bad-boy of the privacy world, behavioral marketing, has its uses, as if I am going to see advertisements, I would prefer to see those related to the locations I will be visiting and my interests as revealed by mining my clickstream rather than hundreds of advertisements for political parties, weight loss products or perfume marketed by Justin Bieber.

8. Do you think the proposed bills will make customers more confident about how their data is being used, and why or why not?

Anyone who uses a mobile phone has no privacy. It may be my crass side, but if users want the benefits of mobile communication and location-based services, including emergency services, then they had better be willing to spend some thought-watts on what about their behavior is discoverable through their mobile phone. However, it seems to be accepted that citizens expect a higher authority to protect them from those things they are unwilling or perhaps unable to self-regulate.
I expect that customers will be more confident about how their data is being used after legislation is enacted, but not realize that the danger here is not always the use of their personal data by companies providing services to them. Significant danger lurks in the form of those with the capability of intercepting your phone transmissions, collecting your position and cloning your data stream with the intention of comprising you, not with the intention of providing you services throughout the years.

9. What are your top 10 crowdsourcing, data collation and verification tips?
While there are best practices for the three areas of data compilation mentioned above, their relevance is tightly bound to the type of system that a service provider has engineered. The reason you see so little spatial data certified as fit for a specific use is quite interesting. One reason is that most corporate lawyers would walk the plank before agreeing to such certification.
The other, and more meaningful distinction, is that we really have no idea of how to certify spatial data as fit for any use. Yes, there are standards and requirements, but these are always followed by convoluted sentence that when properly interpreted means only some of the time.

The most compelling data accuracy problem I see today is that most map and data compilation efforts are drowning in an ocean of data that is both more complex and challenging than dealing with a lack of data. These volumes of data usually get munged together (its a scientific term ha) when creating a product and this process often makes deriving measures of data accuracy obscure and difficult to compute, or perhaps, even difficult to contemplate.

My proscription is to develop an ontology for your data sources and map them into use categories based on the aspects of these data that are of most importance to your corporate mission. Rather than focusing exclusively on how to improve the accuracy of your data collection efforts, I recommend spending time examining the error signatures in your data and the level of satisfaction that these data are contributing to the solution you are providing to your customers and their user-base. It seems appropriate to me that a significant portion of evaluating your data should be a data driven process.

As a final note, change is coming quickly to the world of data compilation. For example, I recently read a short note on the Googles small fleet of driverless cars that are currently deployed in Northern California. These wonders use Bayesian methods to navigate, while relying on information gathered from their sensors to update map information. On the one hand, this could signal that Google thinks that data compilation methods night never be solved through traditional compilation, crowdsourcing, or a hybrid approach using these methods. In essence, what we have today is about as good as we are going to get, so equip the vehicle and let its sensors and computational problems solve the problems if and when they are encountered.

On the other hand, these types of vehicles could easily be used by Google as field vehicles to augment, upgrade and expand the companys map compilation tool chest. Yep, robotic map compilation and why not? Perhaps, almost as interesting, is the fact that the fleet was developed by Dr. Sebastian Thrun of Stanford. You may know him as the father of Googles Street View vehicles.
Hmm...A little image processing, a little text recognition and now the vehicles can identify street signs, road signs, lane markers addresses and everything else a human can see, including people (through facial recognition). Wow, that gives new meaning to real-time search. Now how do we deal with those things those things shown on maps that you cant be seen in the real-world, but that are important to location-based services, like boundaries, crime rates, property values, and?
Re: Entrevista con Dr. Mike Dobson, director de TeleMapics(en ingles) 28 Jul 2011

Pasado un traductor:
El Dr. Mike Dobson, director TeleMapics ', ofrece sus puntos de vista sobre la cartograf?a, la navegaci?n y los datos generados por los usuarios. Dr. Mike Dobson revela el problema con su experiencia del sistema de autoridad en Google Map Maker, son sus puntos de vista sobre el debate sobre la privacidad que rodea la recopilaci?n y almacenamiento de datos basados ? ?en la localizaci?n y la localizaci?n geogr?fica, y que presta sus principales crowdsourcing, el cotejo de datos y consejos para la verificaci?n . Lea todo sobre estos temas y m?s aqu? ...

1. ?Est? de acuerdo que permite a los usuarios crear nuevos puntos de inter?s en los mapas, crea problemas, y por qu? o por qu? no?
Permitiendo a los usuarios de servicios basados ? ?en localizaci?n (LBS) crear nuevos puntos de inter?s (POI) en los mapas es un componente integral de la compilaci?n de mapas modernos. La creaci?n de mapas, puntos de las listas de inter?s o un negocio de bases de datos se pueden beneficiar del uso de crowdsourcing para aumentar la compilaci?n de mapas tradicionales y los procesos de construcci?n de la lista. Es b?sicamente imposible para las empresas comerciales que crean las bases de datos para producir mapas con los puntos de inter?s o puntos que representan las empresas o servicios que est?n siempre al d?a, integral o de alta precisi?n. Alg?n grado de dependencia de los usuarios que est?n "en el terreno" y capaces de observar directamente el lugar en cuesti?n se puede utilizar para mejorar la calidad de todas las bases de datos utilizadas para LBS.
Estamos en las etapas de adopci?n y adaptaci?n de crowdsourcing para satisfacer las necesidades de nuestros clientes, pero es poco probable que cualquier proveedor de datos comerciales que los servicios del mercado de LBS no de alguna manera fundamental adoptar crowdsourcing. Es mi opini?n que nuestras capacidades actuales en cuanto a crowdsourcing son limitados y no nos permite todav?a sacar provecho de los beneficios potenciales de crowdsourcing. Aunque siempre habr? datos err?neos en relaci?n con los contribuyentes que son juegos de azar o spam del sistema, el problema hoy en d?a parece ser que no hemos dise?ado nuestros sistemas basados ? ?en el crowdsourcing para acomodar y remediar este tipo de sesgo. Tampoco hemos logrado optimizar los m?todos utilizados para solicitar y evaluar los conocimientos locales.

Es probable que los sistemas abiertos crowdsourced no puede proporcionar el nivel de exactitud y puesta al datedness que son deseadas por la mayor?a de los usuarios de LBS. En cambio, un enfoque h?brido que utiliza la compilaci?n de datos crowdsourced con fines de detecci?n de cambios, junto con las t?cnicas m?s tradicionales de recopilaci?n de datos se convertir?, si no es ya, uno de los principales m?todos de recopilaci?n de puntos de inter?s, directorio de empresas y datos de los mapas utilizados por todas las empresas comerciales en nuestra industria.

2. ?C?mo pueden los proveedores de mapas de navegaci?n y LBS integrado reduce los errores que se reducir? la calidad de sus soluciones?
La mayor?a de las empresas dependen de las t?cnicas tradicionales de recopilaci?n de datos que suelen incluir un conjunto de herramientas de mapa de recopilaci?n de datos, incluyendo trabajo de campo / observaci?n, la miner?a de datos, uso de las im?genes (de sat?lite y la carretera de lado) fusi?n, edici?n de datos y riguroso control de calidad / garant?a de los procedimientos . Mientras que los errores en el pasado fueron los productos a menudo el resultado de errores de procedimiento en el proceso de compilaci?n o errores de composici?n en el proceso de creaci?n de pel?culas relacionadas con la impresi?n, hoy en d?a vemos los errores de un tipo diferente.
En esencia, el mapa y datos de atributos muchos errores ahora parecen ser el resultado de problemas de sincronizaci?n de bases de datos, confusi?n, la insuficiencia de los sistemas automatizados de control de calidad y el exceso de confianza en las herramientas de software sofisticadas que no son a?n capaces de resolver los problemas por los que fueron dise?ados. El objetivo de la industria debe ser el desarrollo de un "sistema experto" que podr?a ser capaz de remediar los aspectos m?s importantes de estos errores, pero estamos muy lejos de esa soluci?n.
De hecho, considero que el uso de Google de crowdsourcing para corregir errores en su objetivo de base de datos incorporada de los Estados Unidos marc? su capitulaci?n en el concepto de la eliminaci?n de los seres humanos en el proceso de compilaci?n. Tomando a los humanos del proceso es una ambici?n comprensible, ya que son caros, dif?ciles de trabajar e idiosincr?sicos. Sin embargo, no puedo pensar de ning?n proveedor de bases de datos de navegaci?n que no se beneficiar?an de los perspicaces ojos y el intelecto de un exitoso equipo de editores de mapas con formaci?n profesional.
Crowdsourcing se puede considerar como un intento de proporcionar estos editores de mapas humanos "en el barato" y tiene la ventaja de que puede ofrecer el aporte de un numeroso grupo de personas interesadas. Como se se?al? anteriormente, los sistemas de crowdsourcing a?n no han sido desarrollados para el nivel que necesitamos para mejorar dr?sticamente la calidad de las bases de datos cartogr?ficos, pero espero que este problema a resolver en el futuro.
La exactitud de la LBS y los sistemas de navegaci?n se puede mejorar cuando las personas con el conocimiento local contribuyen datos precisos sobre el local, gestionado por un sistema apropiadamente dise?ado crowdsourced. Otras ventajas de la calidad de todos los datos fusionados en una soluci?n LBS puede ser resultado de los an?lisis de los datos recopilados y crowdsourced tradicionalmente a trav?s de su revisi?n por profesionales capacitados en la compilaci?n de mapas. Desafortunadamente, no hay muchos con este tipo de habilidades que permanecen en la fuerza de trabajo y la profesi?n, de haber transformado a partir de mapas de Sistemas de Informaci?n Geogr?fica (SIG), no puede tener la capacidad o habilidad para entrenar a los nuevos.

3. Con referencia a tu blog, ?qu? decir cuando le sugerimos que los ganadores tendr?n un enfoque h?brido, y c?mo se aplica esto a Navteq y Google?
Como se?al? en mi respuesta a la pregunta 1, que soy un defensor de la mezcla de las t?cnicas de compilaci?n tradicional (trabajo de campo / observaci?n), miner?a de datos, uso de im?genes (a?reas, por sat?lite, la carretera del lado), confusi?n, los datos oficiales de edici?n / CC), con un sistema configurado adecuadamente crowdsourcing utilizado para solicitar el conocimiento local acerca de los errores del mapa, actualizaciones y ampliaciones otros (calles, puntos de inter?s Directorio de empresas., direcciones y atributos de datos de distintos tipos (por ejemplo, muebles de la carretera en forma de se?ales de tr?fico, etc.)
Google y Navteq son ejemplos interesantes del enfoque h?brido a la compilaci?n del mapa. Navteq tiene un enfoque mucho m?s potente y dirigido a la observaci?n sobre el terreno de Google. Por el contrario, Google tiene un m?todo mucho m?s poderoso de la recopilaci?n de datos de Navteq crowdsourced.

Ambas compa??as tienen acceso a los datos crowdsourced en forma de "pasiva Crowdsourcing", que consiste en el seguimiento de los telefonos celulares o v?a GPS de otros dispositivos equipados de personas viajan a trav?s de un medio ambiente. Estos datos permiten extraer la geometr?a de la calle, los tiempos de viaje, el flujo de tr?fico y una gran variedad de informaci?n, pero estas plataformas no proporcionan informaci?n sobre nombres de calles, direcciones o informaci?n de otro atributo que en la actualidad tiene que ser capturado por la observaci?n del medio ambiente , en lugar de inferencias hechas por la tramitaci?n de un camino en una gr?fica.

Por el contrario, "Active Crowdsourcing" se basa en la buena voluntad de un usuario que se?ala un error en el mapa u omisi?n y decide contribuir de manera directa informaci?n a trav?s de un sistema en l?nea de manera que pueda resolver el problema que se observa, mientras que en el ?rea local. Google Maps ofrece al usuario una variedad de maneras de resolver estos problemas, incluyen el uso de Google Map Maker.
Google se beneficia de la enorme cantidad de personas que parecen estar dispuestos a corregir los Mapas Google y proporcionar esa informaci?n a Google sin honorarios. Navteq en gran medida se basa en su Map Reporter, que no genera un tr?fico importante.

4. ?De qu? manera crowdsourcing aumentar el valor de los servicios basados ? ?en localizaci?n que ofrecen a los clientes, y c?mo se pueden garantizar los puntos de inter?s son relevantes para un individuo en particular?
Crowdsourcing aumenta el valor de los servicios de localizaci?n mediante la posibilidad de aumentar el numero de puntos de inter?s en una base de datos, as? como el aumento de su puesta al datedness y su amplitud mediante la aportaci?n de informaci?n de contacto, direcci?n, horario de servicio, otros servicios ofrecidos, etc
Una clave para la utilidad de un sistema de crowdsourced es el numero de personas dispuestas a aportar datos, atenuado por su intenci?n, capacidad de observaci?n, y su distribuci?n espacial y temporal. Es mi creencia de que la base de usuarios de Google Maps es muy grande y muchos de estos usuarios est?n dispuestos a aportar datos para mejorar la calidad del producto. M?s contribuyentes en general, equivalen a una mayor precisi?n de los datos crowdsourced, como resultado de m?s ojos viendo y evaluando el mismo problema, as? como la probabilidad de que m?s ojos descubrir y solucionar otro mapa o problemas de base de datos.
La pr?ctica esencial de crowdsourcing es que el sistema se centra en atraer a los usuarios locales que pueden aportar informaci?n acerca de los problemas con los mapas de las zonas donde viven, trabajan, compran y juegan. Estos contribuyentes potenciales a los sistemas de crowdsourcing son los que saben que las tiendas son en realidad en los negocios, donde se encuentran, las horas que est?n abiertos al p?blico y cuando han salido del negocio. Cada empresa que trata de recoger estos datos se basa en alg?n tipo de medida de sustituci?n que puede tomar meses o incluso a?os para filtrar su camino a trav?s del proceso de compilaci?n y en su base de datos, por no mencionar la cantidad de tiempo que tomar? para que estos datos sean distribuye y se muestran despu?s en los sistemas basados ? ?en ubicaci?n.
Crowdsourcing es una forma de cortocircuito este camino y llevar la informaci?n nueva o actualizada a estas bases de datos en un per?odo muy corto de tiempo. Tradicional mapa o una lista de t?cnicas de compilaci?n de construcci?n no ofrecen este tipo de beneficio, aunque s? ofrecen un punto de referencia para el aumento de las t?cnicas de crowdsourcing.
Asegurar que los puntos de inter?s crowdsourced son relevantes para un cliente particular puede ser tratado en una variedad de maneras, pero una fusi?n de varias t?cnicas se requiere para el ?xito. Es mi opini?n los sistemas crowdsourced no puede ser "abierto" y satisfacer las necesidades de los proveedores de datos comerciales de productos de calidad. En cambio, el sistema comercial crowdsourced deben tener una estructura en t?rminos de lo que pueden y no pueden ser editadas, incluyendo las categor?as de uso de los datos que se puede aportar. Si bien esto es restrictiva para el contribuyente y cuesta un poco acostumbrarse a, es necesaria si el proveedor de bases de datos es de dar sentido a crowdsourced entradas de datos.
A continuaci?n, es imprescindible que el proveedor de la mina de servicios basados ? ?en la localizaci?n de la secuencia de clics de los usuarios para determinar lo que se busc? en el que la ubicaci?n geogr?fica. El proveedor debe tener una comprensi?n de lo que el usuario se o "es posible", han estado buscando por la ubicaci?n, as? como alg?n tipo de evidencia que se encuentra o no encontrar aquello para lo que estaban buscando. Usando t?cnicas avanzadas que el proveedor pueda obtener una comprensi?n del ?xito de puntos de inter?s en el cumplimiento de los requisitos de los usuarios para la b?squeda y localizaci?n, particularmente si el usuario est? en un dispositivo m?vil y se desplaza hacia o cerca de la ubicaci?n de los puntos de inter?s.
La evaluaci?n de la estructura de la conducta de b?squeda permite al proveedor tasa de POI, los contribuyentes de puntos de inter?s, la eficacia espacial de su base de datos de puntos de inter?s y una serie de factores que pueden ser utilizados para identificar las ?reas que necesitan ser actualizadas, tal vez por los esfuerzos de compilaci?n tradicional.

5. ?Por qu? los clientes m?s peque?os requieren menos atenci?n, y por el contrario, ?por qu? los m?s grandes de la demanda m?s de lo mismo?
Clientes m?s peque?os por lo general no tienen el tiempo para comercializar con eficacia sus negocios, ya que los propietarios pasan la mayor parte de su tiempo de funcionamiento en realidad su tienda o servicio. Incluso en los d?as de P?ginas Amarillas y anuncios clasificados, estas son las empresas que no anuncian a menos que alguien entr? en su tienda y fue f?cil de que lo hagan. En la era de Internet, estas empresas demandan menos atenci?n, debido a que el mecanismo de distribuci?n de Internet en gran parte los ignora, como en la "larga cola" y, por diversas razones, no pueden ser agregados con un beneficio significativo.

Mientras que Google y otras compa??as ofrecer servicios que permiten a los propietarios de peque?as empresas a reclamar su negocio, el numero de propietarios de peque?as empresas tienen tiempo para hacer esto en Google, Bing, Yahoo, InfoUSA (ahora Infogroup) y otros servicios? S?, hay preparadores que ofrecen este tipo de servicios para los propietarios de peque?as empresas, pero estas personas nunca entrar en el negocio de peque?os comerciantes propietarios y solicitar su negocio, a diferencia de los propietarios al ver el tipo de las P?ginas Amarillas, que trae un libro con su lista de empresas en ella? ?Qu? significar?a para cualquiera de estas personas si cumplen con el evangelista de b?squeda de servicios de b?squeda estrat?gica de Sussex y c?mo se entienden los beneficios que esta empresa podr?a ofrecer?
Grandes clientes demandan m?s atenci?n, porque tienen "poder adquisitivo". A menudo, estas empresas est?n en el segmento de "elite" de los clientes de los que han entrado en los contratos con los importantes ingresos que beneficien a los socios proveedores. Adem?s, los clientes m?s grandes son a menudo m?s preocupados por su marca y tienen marcas que son conocidas en todas las ?reas de mercado de tama?o significativo.
Estas empresas suelen tener equipos de marketing y empresarial centrado en la identificaci?n y la protecci?n de advantaging el estado de su marca. Por ejemplo, los proveedores de datos que no tienen la ubicaci?n de los puntos de la compa??a un socio importante de la publicidad colocada correctamente y publicado con la informaci?n de contacto correcta y las horas de operaciones son por un periodo problem?tico. Por el contrario, el due?o de la tienda individuo no puede incluso saber que usted tiene mislocated su empresa o en el que realmente han logrado publicar la lista en l?nea.

6. ?Cu?l fue el problema con su experiencia con el sistema de autoridad en Google Map Maker, y para los no iniciados, ?qu? es?
Map Maker es una aplicaci?n desarrollada por Google para que la gente crear y actualizar mapas basados ? ?en la digitalizaci?n de la red de transporte (principalmente las calles y carreteras) de las im?genes (de sat?lite o a?reas) Google publica para este prop?sito. Adem?s, el sistema permite a los usuarios con el conocimiento local para aumentar estos datos a trav?s de la adici?n de detalles relevantes que no se pueden derivar de las im?genes, tales como numeros de calle, nombres de calles, direcciones, puntos de inter?s y actualidad, etc Inicialmente, Map Maker se disponibles principalmente para los usuarios en los pa?ses donde Google no pudo proporcionar un mapa detallado, la base actual.
En cierta medida los objetivos de Map Maker fueron los pa?ses que no proporcionan a Google, en ese momento, a su hoja de base de datos de proveedores de Tele Atlas y Navteq. Adem?s, algunas ?reas geogr?ficas donde se le ofreci? Map Maker hab?a producido un excelente gobierno-los mapas de base, pero debido a restricciones de derechos de autor sobre su uso y el alto costo de las licencias se trataba generalmente no est? disponible para uso p?blico.
M?s recientemente, Google decidi? utilizar Map Maker como una de las opciones de edici?n / correcci?n para los usuarios de la base de mapas de Google en los Estados Unidos, una base de datos de mapa de Google que construy? de forma independiente de Tele Atlas y Navteq.
En esencia, las modificaciones y actualizaciones que los usuarios sugieren que se hizo con el mapa de Google de los EE.UU. son crowdsourced a trav?s de la utilizaci?n del sistema de Google Map Maker, que permite editar las calles, carreteras, puntos de inter?s y otros datos seleccione, seg?n lo permitido por Google. Basado en mi experiencia a trav?s de Google Map Maker, parece que aunque se puede presentar cambios de calles, carreteras y direcciones, no se pueden modificar directamente los aspectos espec?ficos de la geometr?a de la v?a, ni se puede alterar o proporcionar informaci?n de l?mite para los estados, condados, ciudades, pueblos , c?digo postal u otros muestran ?reas geogr?ficas.
Verdaderos sistemas crowdsourced confiar en la gente a evaluar y volver a editar las alteraciones del mapa cuando se cree que estas contribuciones son err?neas. Por ejemplo, MapQuest, en el uso de los datos de OSM para algunos de los sitios web de navegaci?n que publica, ofrece algunos tipos de cambios que se hacen a la base de datos principal de OSM a su instancia de la base de datos en cuesti?n de minutos, aunque incluso los m?s complejos tipos de datos que requieren un procesamiento adicional (por ejemplo, los relacionados con los atributos de enrutamiento) pueden ser publicados en menos de un d?a. Una raz?n de la "necesidad de velocidad" en este tipo de sistemas es que los otros antes ver los datos, m?s r?pido se puede corregir si err?neos. Google, sin embargo, ha adoptado un enfoque diferente.
Actualmente en Map Maker ediciones de las contribuciones de Google Maps base de EE.UU. mapa hecho por los usuarios son enviados a trav?s de Map Maker y evaluados por los empleados de Google. Estas personas, denominadas "de confianza revisores mapa" de Google, tiene la autoridad para aceptar, rechazar, corregir o simplemente ignoran las contribuciones hechas por los usuarios.
La precisi?n de un sistema de crowdsourced se basa en el concepto de la participaci?n local de los usuarios locales que han observado el lugar en cuesti?n. Editores de mapas que tienen la tarea de evaluar esta entrada debe tener al menos la misma familiaridad con la verdad de tierra local, o se tienen dificultades para evaluar de manera efectiva los datos facilitados por el usuario. Por desgracia, al menos en lo de hace un mes, estos "cr?ticos de confianza del mapa" no se basaban en los Estados Unidos, ni hay ninguna raz?n para creer que estos editores estaban familiarizados con cualquiera de la geograf?a en relaci?n con las contribuciones que estaban evaluando. Adem?s, parece que su experiencia en la cartograf?a se limita a su familiaridad con la herramienta de Google Map Maker.
El proceso en el que el Google "confianza mapa revisores" base para juzgar si las correcciones son correctas o no parece ser se basan en si la correcci?n es identificable, razonable o l?gica basada en un examen de las im?genes de Google para la zona (tanto por sat?lite y Street View si est? disponible), pero el proceso no parece que el uso de los datos, incluyendo el "conocimiento local".
Aquellos de ustedes que han pasado cualquier cantidad de tiempo con la base de im?genes de Google Maps puede haber observado que no siempre es, comprensiblemente, hasta al d?a. Por esta raz?n, su eficacia se puede considerar "limitada" en t?rminos de la resoluci?n de problemas que son posteriores a la recolecci?n de im?genes, que, para ser claros, rara vez es identificada por la fecha de autor, siempre en la imagen. Adem?s, las im?genes pueden ser de poca ayuda en el intento de entender los cambios en el estado de puntos de inter?s, o que se deriven informaci?n de atributos ?tiles para la navegaci?n.
Si se toma el tiempo para examinar las condiciones del servicio de moderar las correcciones Google Map Maker, se encuentra esta afirmaci?n: "Usted est? de acuerdo y se comprometen a que la intenci?n que subyace detr?s de Usuario moderador es para quitar cualquier sumisi?n que usted sabe que a trav?s de su conocimiento local personal o o inadecuado o incorrecto de hecho y de la aprobaci?n de dichos Archivos de Usuario que a su conocimiento personal son exactos. "Por supuesto, estas son las reglas para los usuarios con Map Maker en los pa?ses donde se les permite evaluar las contribuciones de sus compa?eros.
Curiosamente, sin embargo, en los Estados Unidos, el uso de Map Maker para editar el Google Maps Estados Unidos Producto se lleva a cabo por un equipo que, aunque muy agradable, no tiene absolutamente ning?n conocimiento local acerca de la geograf?a se?alado en las contribuciones que evaluar. Desde mi perspectiva, el proceso de ingenier?a como en la actualidad est? desconectado de algunas de las ventajas potenciales de los sistemas dise?ados adecuadamente que el uso de crowdsourcing como un m?todo de recopilaci?n de mapas, puntos de inter?s y datos de negocios. Para aquellos interesados ? ?en un mayor an?lisis en profundidad de este tema, ver a mis dos blogs parte de Google Map Maker en /? p = 371.

7. ?Cu?les son sus puntos de vista sobre la opini?n de la Comisi?n Federal de Comunicaciones sobre la privacidad y los servicios basados ? ?en la localizaci?n?
La privacidad es un tema delicado para los servicios basados ? ?en ubicaci?n, pero que necesita ser comprendido y evaluado con respecto a los "deseos" de su comunidad de usuarios. Desde un punto de vista de servicio, los usuarios dispuestos a liberar un lugar a un proveedor de servicios LBS no podr? utilizar el servicio de una manera sencilla y pr?ctica. Sin embargo, es mi opini?n que los usuarios necesitan para decidir esta cuesti?n por s? mismos, en base a su evaluaci?n de los riesgos y beneficios.
Sin embargo, estoy de acuerdo en que es necesario que haya una "exclusi?n" para los usuarios de menos de cierta edad, hay que prohibir su presa de otros, o consumo de servicios no est?n dise?ados o tal vez ilegal que el grupo de edad. Sin embargo, mi pr?ctica de consultor?a no se centra en los problemas de privacidad y tengo que no tienen ideas perspicaces sobre todo en la forma de privacidad pueden ser implementadas y se conserva en los sistemas basados ? ?en la localizaci?n.
Voy a decir que incluso el "chico malo" del mundo de la intimidad, el marketing de comportamiento, tiene sus usos, como si yo voy a ver anuncios, yo preferir?a ver a los relacionados con los lugares que visitar? y mis intereses como revelado por la miner?a mis clics en lugar de cientos de anuncios de los partidos pol?ticos, los productos para bajar de peso o el perfume comercializado por Justin Bieber.

8. ?Cree usted que los proyectos de ley har? que los clientes m?s confiados acerca de c?mo sus datos se est? utilizando, y por qu? o por qu? no?
Cualquier persona que utilice un telefono m?vil no tiene privacidad. Puede ser mi lado grosero, pero si los usuarios desean obtener los beneficios de las comunicaciones m?viles y servicios basados ? ?en localizaci?n, incluidos los servicios de emergencia, y m?s les vale estar dispuesto a pasar un "pensamiento-watts" en lo que acerca de su comportamiento se puede detectar a trav?s de sus m?viles telefono. Sin embargo, parece que se acepta que los ciudadanos esperan que una autoridad superior para protegerlos de esas cosas que no quieren o no tal vez para autorregularse.
Espero que los clientes se sentir?n m?s seguros acerca de c?mo sus datos se utiliza cuando la legislaci?n es aprobada, pero no se dan cuenta de que el peligro aqu? no es siempre el uso de sus datos personales por empresas que prestan servicios a los mismos. Gran peligro acecha en la forma de los que tienen la capacidad de interceptar las transmisiones de telefono, el cobro de su posici?n y la clonaci?n de su flujo de datos con la intenci?n de que comprende usted, no con la intenci?n de proporcionarle servicios a lo largo de los a?os.

9. ?Cu?les son sus 10 mejores crowdsourcing, el cotejo de datos y consejos para la verificaci?n?
Si bien no son las mejores pr?cticas para las tres ?reas de la compilaci?n de los datos antes mencionados, su relevancia est? estrechamente vinculada con el tipo de sistema que un prestador de servicios de ingenier?a. La raz?n por la que ver los datos espaciales tan poco declarado apto para un uso espec?fico es muy interesante. Una raz?n es que la mayor?a de los abogados corporativos que caminar por la plancha antes de acceder a dicha certificaci?n.
La otra distinci?n, y m?s significativo, es que realmente no tienen idea de c?mo certificar los datos espaciales como aptos para cualquier uso. S?, hay normas y requisitos, pero estos siempre son seguidas por frase complicada que cuando se interpretan correctamente los medios "s?lo una parte del tiempo".

El problema de exactitud de los datos m?s convincentes que veo hoy es que la mayor?a de los mapas y los esfuerzos de recopilaci?n de datos se est?n ahogando en un oc?ano de datos que es a la vez m?s complejas y dif?ciles de tratar con la falta de datos. Estos vol?menes de datos suelen "munged" juntos (es un t?rmino cient?fico - ha) al crear un producto y este proceso a menudo hace que se derivan de medidas de precisi?n de los datos poco claros y dif?ciles de calcular, o quiz?s, incluso dif?cil de contemplar.

Mi proscripci?n es desarrollar una ontolog?a de sus fuentes de datos y el mapa de ellos en las categor?as de uso basado en los aspectos de estos datos que son de mayor importancia para su misi?n corporativa. En lugar de centrarse exclusivamente en la forma de mejorar la exactitud de sus esfuerzos de recopilaci?n de datos, recomiendo pasar el tiempo de examinar las firmas de error en sus datos y el nivel de satisfacci?n que estos datos est?n contribuyendo a la soluci?n que est? ofreciendo a sus clientes y sus usuarios base. Parece apropiado para m? que una parte importante de la evaluaci?n de los datos debe ser una "... basada en los datos del proceso."

Como nota final, el cambio est? llegando r?pidamente al mundo de la recopilaci?n de datos. Por ejemplo, hace poco le? una breve nota sobre la peque?a flota de coches de Google sin conductor que se encuentran actualmente desplegados en el norte de California. Estas maravillas utilizar los m?todos bayesianos para navegar, mientras que conf?an en la informaci?n obtenida de los sensores para actualizar la informaci?n del mapa. Por un lado, esto podr?a ser una se?al de que Google cree que los m?todos de recopilaci?n de datos noche nunca se resuelven a trav?s de la compilaci?n tradicional, crowdsourcing, o un enfoque h?brido con estos m?todos. En esencia, lo que tenemos hoy en d?a es casi tan bueno como lo vamos a conseguir, as? que equipar el veh?culo y deje que sus sensores y problemas de c?lculo resolver los problemas, siempre y cuando se encuentren.

Por otro lado, este tipo de veh?culos podr?an ser f?cilmente utilizado por Google como veh?culos de campo para aumentar, mejorar y ampliar la empresa compilaci?n mapa caja de herramientas. S?, la compilaci?n del mapa rob?tica y por qu? no? Tal vez, casi tan interesante, es el hecho de que la flota fue desarrollado por el Dr. Sebastian Thrun de Stanford. Es posible que lo conocen como el "padre" de la calle de Google veh?culos Vista.
Hmm ... Un poco de procesamiento de im?genes, reconocimiento de texto y ahora los veh?culos pueden identificar las se?ales de tr?fico, se?ales de tr?fico, las direcciones de los marcadores de pista y todo lo que un humano puede ver, incluyendo a las personas (a trav?s del reconocimiento facial). Wow, que da un nuevo significado a la "b?squeda en tiempo real." Ahora, ?c?mo lidiar con esas cosas las cosas que se muestran en los mapas que no se puede ver en el mundo real, pero que son importantes para los servicios de localizaci?n, l?mites como, las tasas de criminalidad, los valores de la propiedad, y ...?
