Polskie książki niebawem w Google

Długi ogon...

Długi ogon. To absolutnie działa w przypadku Google, szczególnie jeśli chodzi o Book Search. Dajmy na to, że publikujesz książkę dotyczącą orchidei w Peru. Trudno będzie ją sprzedać w zwykłej księgarni. Statystycznie w małej lokalnej księgarni, ktoś zapyta o taki tytuł raz na 45 lat. Zapewne na całym świecie jest kilka tysięcy ludzi, których interesują orchidee z Peru. Jednak dzięki Sieci te parę tysięcy ludzi ma dużo większe szanse dotarcia do interesującego ich pozycji - a z kolei wydawca takiej książki może znaleźć nowych nabywców.

Google Book Search

Google Book Search to realizacja idei Google by uporządkować światowe zasoby informacji, uczynić je powszechnie dostępnymi i użytecznymi.

Google Book Search umożliwia pełnotekstowe przeszukiwanie treści kilkuset tysięcy książek pochodzących z największych bibliotek świata oraz bezpośrednio od wydawnictw.

W krajach, gdzie usługa działa w pełni, wyniki wyszukiwania treści książek są uwzględniane w ogólnych wynikach wyszukiwarki Google.

http://books.google.com

Polska branża obawia się nowych rozwiązań technologicznych. Wielu wydawców traktuje rozwiązania takie jak Google News czy Book Search jako zagrożenie.

Nowoczesne technologie zawsze stanowiły wyzwanie dla branży wydawniczej. Dwanaście lat temu, gdy pracowałem w Axel Springer, wydawcy byli bardzo niechętni zmianom jakie przyniósł internet i obawiali się wejścia online. Technologia i jej rozwój niewątpliwie mogą zakłócać spokój wydawnictwa. Ale proszę spojrzeć co stało się z muzyką online - to co wydawało się zagrożeniem kilka lat temu dziś okazuje się być intratnym biznesem.

Jak wygląda techniczna strona tego przedsięwzięcia? Gdzie skanujecie te nieprzebrane ilości książek?

Mamy dwie metody na digitalizację. Pierwsza jest przeznaczona dla książek, które dostaliśmy od wydawnictw. Zabieramy je do naszej siedziby w Mountain View, gdzie poddajemy je specjalnemu procesowi skanowania. Przy wykorzystaniu tej metody książki ulegają zniszczeniu - wycinamy je w ten sposób, że egzemplarz przekształca się w stos luźnych kartek. Następnie wkłada się je do gigantycznych maszyn skanujących. Oczywiście skanowanie nie jest rzeczą, którą lubimy najbardziej. To kosztowne i wymaga czasu.

Druga metoda jest zarezerwowana dla książek pochodzących z bibliotek. Łatwo sobie wyobrazić, że nie możemy po prostu zabrać książek z New York Public Library i pociąć ich na kawałki. Opracowaliśmy więc w Google specjalną procedurę, która umożliwia digitalizację książek przy użyciu fotografii cyfrowej. Dzięki niej egzemplarze nie doświadczają prawie żadnego nacisku mechanicznego.

Czy strony tak skanowanej książki są przewracane przez maszyny?

Nie. Robią to ludzie, aby zapewnić jak najwyższą jakość tej przeróbki.

Takie skanowanie także odbywa się w Kalifornii?

Czasem tak. Mamy także własne siedziby przy dużych bibliotekach np. w Oksfordzie czy Madrycie.

A OCR (optyczne rozpoznawanie znaków - red.) nie jest barierą? Co z rozpoznawaniem znaków narodowych? Np. polskich?

OCR możemy przeprowadzać dla dokumentów w wielu językach, włączając w to język polski czy cyrylicę. Oczywiście nie mamy 100% dokładności, ale jej nie potrzebujemy. To, co użytkownik ogląda na ekranie korzystając z Google Book Search, to graficzna wersja książki, także czytelnik zawsze widzi to, co zostało zeskanowane, a nie znaki rozpoznane i przetworzone przez oprogramowanie OCR.

Macie już tyle zeskanowanych książek. Myśleliście o tym, żeby zacząć na nich zarabiać? Co ze sprzedażą e-booków?

Dzisiaj zajmujemy się przede wszystkim pośrednictwem - kontaktujemy czytelnika z wydawnictwem. Google Book Search jest potężnym marketingowym narzędziem, wolnym od opłat. Użytkownik, który odkryje Google Book Serach może kupić książkę korzystając z odnośnika do wydawcy, sprzedawcy lub lokalnej księgarni za rogiem.

Wywiad autoryzowany