Nowe elementy integracyjne WebSphere

IBM przygotowuje kolejną wersję platformy integracji informacji, która ma ułatwiać porządkowania zasobów danych w przedsiębiorstwach łącząc przeszukiwanie danych, zarządzanie zawartością i technologie wyszukiwania.

Kolejna wersja zestawu WebSphere Information Integrator, o kryptonimie Serrano, ma zawierać udoskonaloną technologię wyszukiwania, wykorzystującą algorytmy przetwarzania języków naturalnych do wyciągania istotnych danych z dokumentów korporacyjnych.

Udoskonalona platforma, planowana na koniec b.r., ma zawierać narzędzia służące do wykrywania potencjalnych powiązań pomiędzy różnymi źródłami danych. I tak, narzędzie te może przeszukiwać np. bazy danych Oracle - zawierające informacje o klientach, bazy danych IBM - zawierające transakcje sprzedaży i wyszukać wzajemne połączenia między nimi, niezwykle przydatne w działalności marketingowej.

Platforma będzie także łączyć mechanizmy zarządzania zawartością, takie jak zdolność do zmiany i wstawiania przypisów w dokumentach, z mechanizmami wyszukiwania. W środowisku przedsiębiorstwa często zachodzi potrzeba współdzielonego tworzenia dokumentów i dysponowania możliwością wyszukania dokumentu i dodania do niego informacji istotnej z punktu widzenia przedsiębiorstwa.

Zainteresowanie technologiami integracji informacji rośnie w miarę powiększania się zasobów danych w przedsiębiorstwach - firmy poszukują sposobów tworzenia skonsolidowanego spojrzenia na dane rozproszone w wielu wewnętrznych i zewnętrznych systemach. Technologie te pozwalają agregować, synchronizować i kwerendować dane fizycznie rozproszone, tak jakby były zgromadzone w jednym repozytorium. Zamiast kopiowania danych do centralnego repozytorium, technologia integracji informacji umożliwia pozostawienie danych u źródła i jednocześnie utworzenie wirtualnie zintegrowanego oglądu, rezydującego w pamięci i pozwalającego na kwerendowanie według potrzeb.

Kluczowym mechanizmem technologii integracji informacji jest zdolność obsługi zarówno strukturalizowanych jak i niestrukturalizowanych źródeł danych. Szacuje się bowiem, że około 85 proc. informacji w przedsiębiorstwach zawartych jest właśnie w dokumentach niestrukturalizowanych, takich jak wiadomości pocztowe, pliki tekstowe itp. Dane strukturalizowane, to te przechowywane zazwyczaj w relacyjnych bazach danych.

Przedsiębiorstwa coraz częściej poszukują wsparcia w technologiach integracji informacji. Oprócz IBM także inne firmy zajmujące się bazami danych i systemami eksploracji danych, m.in. Microsoft i Oracle, interesują się rynkiem integracji informacji.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200