28.02.2017  - Viacheslav Ilchenko -  Analytiikka

Informaticalla tietovirrat haltuun

Data virtaa yritykseen monesta eri lähteestä, monessa eri formaatissa, suuruusluokassa ja muodossa. Dataintegraation tehtävänä on yhdistää ja jalostaa lähteistä tuleva tieto sellaiseen muotoon, että sitä voi tehokkaasti ja luotettavasti käyttää päätöksentekoon yrityksessä. Perinteisen dataintegraatioarkkitehtuurin keskeinen osa on tietovarasto. Tietovarastossa raaka data puhdistetaan, yhdenmukaistetaan, aggregoidaan ja julkaistaan Data Mart -rajapintojen kautta.

Perinteisellä teknologialla on kuitenkin mahdotonta käsitellä ja varastoida kasvavien suuruusluokkien dataa, varsinkin puolistrukturoitua ja ei-strukturoitua dataa, kuten tekstit, ääninauhoitukset, kuvat, videot, mittausten tulokset jne. Tällaisen big dataksi kutsutun datan varastoimista ja prosessointia varten on kehitetty uusia teknologioita, joista Apache Hadoop on yksi merkittävimpiä. Perinteinen Data Mart hyödyntämisrajapintana ei täytä kaikkia nykyajan vaatimuksia. Data Lake (datajärvi) on keskitetty tallennuspaikka, johon tallennetaan data alkuperäisessä formaatissa. Data Lake voi toimia ketteränä itsepalveluratkaisuna, jonka kautta käyttäjät pääsevät itse tutkimaan dataa ja tekemään siitä löydöksiä. Käytännössä uusi Big Dataan orientoitu teknologia ei korvaa perinteistä teknologiaa ja arkkitehtuuria, vaan täydentää sitä. Se tarkoittaa, että tieto virtaa myös tietovaraston ja datajärven välillä molempiin suuntiin.

Informatica tarjoaa dataintegraatioratkaisut sekä perinteiseen että uuteen arkkitehtuurimalliin. Informatica Power Center (PWC) on metadatapohjainen dataintegraatioalusta, joka on tarkoitettu ETL-prosessien ja tietovarastojen rakentamiseen, ylläpitoon ja hallintaan. Informatica Big Data Edition (BDE) on uusi integraatioalusta, joka mahdollistaa perinteisten toimintojen lisäksi ETL-transformaatioiden suorittamisen Hadoop-klusterissa. Informatica BDE:n avulla pystyy myös kopioimaan dataa Hadoop-klusterista erilaisiin tietokantoihin ja takaisin. Informatican graafisilla työkaluilla on helppo rakentaa datan latausprosessit ja transformaatiot, sekä seurata tietovirtojen kulkua reaaliajassa. Intuitiivisen ja helppokäyttöisen käyttöliittymän lisäksi Informatica-alustan valttina on myös kehitettyjen komponenttien uudelleenkäytettävyys sekä kattava dataformaattien ja tietokantojen tuki. Metadatan ansiosta on mahdollista kätevästi analysoida datan lähteiden ja julkaistavan aineiston väliset riippuvuudet. Informatican tuotevalikoimaan kuuluvat myös muut dataintegraatiota tukevat ratkaisut, mm. Informatica Data Quality (IDQ), Master Data Management (MDM), Informatica Metadata Manager, Cloud Integration, Data Security.

Tiedon rooli organisaation toiminnassa ja menestyksessä kasvaa vauhdilla. Joskus sanotaan, että data on uusi öljy. Sopivan dataintegraatioarkkitehtuurin ja teknologian valinnan merkitys on tärkeää, jotta tiedon hyödyntäminen organisaatiossa on tehokasta. Informatica tarjoaa modernit ja toimivat teknologiaratkaisut, jotka kehittyvät uusimpia digitalisaation trendejä seuraten.