Nastavení datových typů u dat v datatasku.

Až dosud se jednotlivé proměnné získané z datových zdrojů (Meta, Adform, Sklik, Google, H3.0, Social SOV = Ads Transparency data apod.) do cílových destinací (Google Big Query, interní databáze) posílaly tak, jak ze zdroje přišly. Většina proměnných byla v cílové databázi registrována jako STRING.

Co je nového?

Nyní jsme celou situaci vylepšili a je možné v rámci nastavení DataTasku jednotlivým sloupcům přiřadit datové typy podle názvů těchto sloupců v cílové databázi. Zároveň máme k dispozici předdefinované názvy sloupců s jejich doporučenými datovými typy.

Co se tím zlepší?

  1. pohodlnější vizualizace – pokud máte v cílové databázi definovaný datový typ číslo, budou to tak brát vizualizační softwary (Looker Studio, Power BI, Tableau) rovnou a nebude nutné tento typ ve vizualizaci předefinovávat
  2. lepší kompatibilita s Google Big Query, která má občas s datovými typy problémy

Jak nové datové typy nastavit?

Při editaci nebo založení DataTasku je v dolní části formuláře k dispozici nové tlacítkom Nastavení datových typů.

Po kliknutí na toto tlačítko se zobrazí 3 velké pole formuláře, kde se datové typy nastavují. Do každého pole formuláře se vkládají názvy sloupců v cílové databázi, které chcete uložit jako patřičný datový typ, který se určuje podle toho, ve kterém poli formuláře je proměnná napsána:
– Desetinné číslo (MySQL DOUBLE, Google Big Query NUMERIC)
– Celé číslo (MySQL BIGINT, Google Big Query INTEGER)
– Datum (MySQL DATE, Google Big Query DATE)

Pokud kliknete na tlačítko “Default” u daného pole formuláře, vloží se do daného pole námi předvybrané názvy sloupců. Pokud poté kliknete na tlačítko Saved, vrátí se do pole hodnoty, které máte aktuálně u DataTasku uložené.

V případě, že název sloupce nezvolíte do žádného z těchto polí, bude do databáze vloženo jako STRING.

Defaultní názvy sloupců máme zatím zprovozněné pro následující zdroje dat:
– H3.0 Campaigns and Placements
– META Ad Transparency
– GBQ Ad Transparency

Nekolik důležitých poznámek pro přechod na tuto novou funkci:

Funkce nastavení datových typů sloupců funguje nejlépe u nově vytvořených tabulek. Pokud byste chtěli měnit již naplněnou tabulku, nemusí být funkce v této operaci úspěšná. Proto pro zavedení této funkce doporučujeme založit nové tabulky v databázi (nebo ty předchozí vyprázdnit i vymazat strukturu).

Ve starých DataTascích (ty před update, které tuto novinku obsahuje) zůstane vše jako dřív, ale při jejich editaci se systém pokusí vám nastavit nové datové typy. Pokud je nechcete a potřebujete DataTask změnit a uložit, prostě je z daných polí vymažte.

Upozornění!!

Pokud nastavíte cílový datový typ, který není kompatibilní s hodnotou proměnné, například pokud je proměnná campaign_name na vstupu “STRING”, má hodnotu “Velká kampaň” a vy se z ní pokusíte udělat číslo nebo datum, bude hodnota v cílové databázi nesmyslná / nulová.

Jak vkládat data z H3.0 do Google Big Query – H3.0 metrics (H3.0 -> GBQ)

Nový zásadní pilíř H3.0 nazvaný “H3.0 metrics” umožňuje přesouvat různá data pomocí H3.0 do jiných databází, aby s nimi bylo možné pracovat například při datové vizualizaci.

Jedním z modulů H3.0 metrics je H3.0 -> GBQ, tedy modul umožňující pravidelně aktualizovat data o kampaních v H3.0 do Google Big Query databáze.

Jak se takové propojení nastaví?

Nejdříve si nastavíme Google Big Query (GBQ), poté s GBQ propojíme H3.0 a nakonec řekneme H3.0, aby do GBQ pravidelně posílal data.

GOOGLE BIG QUERY

  1. založte nový projekt v Google Big Query
  2. V GBQ / SQL workspace si otevřete data projektu a založte Data set pro H3.0 data, papříklad (H30metrics)
  3. v Datasetu su vytvořte tabulku. Můžete si je vytvořit rovnou 3, protože máme 3 typy tabulek: kampaně celkem, placementy celkem a pokud jste opravdu blázni a chcete riskovat obrovské množství dat a všechny problémy, které s tím mohou nastat, tak i placementy daily. Tedy v našem testovacím případě vytváříme 3 tabulky:
    – h30campaignstotal
    – h30placementstotal
    – h30placementsdaily
  4. A tím pádem máte nastavení GBQ hotové.

PROPOJENÍ H3.0 A GBQ

Do H3.0 vložíme loginy do Google Big Query, aby se systémy mohly domlouvat.

V Administrace/nastavení/Propojení s ostatními systémy nascrollujeme dolů až na oddíl Google Big Query a klikneme na Nový. V otevřivším se okně je vždy alespoň nějak aktualizovaný návod, nicméně je třeba:

  1. V Google Consoli v daném projektu v IAM and admin / Service account vytvořit Service Account, dát mu patřičná práva (potřebuje i zápis, takže optimálně všechny). Tento account bude potřebovat H3.0 pro přístup.
  2. E-mail tohoto service accountu vložte do pole GBQ login formuláře e-mail v H3.0
  3. Pro Service account vytvořte “Key”, typ .json a ten si stáhněte a vložte ho do H3.0 formuláře.
  4. Zvažte, jestli login budou mít přístupni všichni H3.0 uživatelé s povoleními pro GBQ loginy a pokud ano, tak v H3.0 ještě vlevo nahoře zaškrtněte přepínač Veřejné.
  5. Klikněte na Save, poté si ten login přes Open znovu otevřete a vlevo nahoře klikněte na tlačítko Test. H3.0 se zkusí připojit do GBQ a pokud bude vše OK, nahlásí 2x zelené OK. Pokud tam bude něco červeně, udělali jste někde chybu. Nezoufejte a napište nám, zkusíme vám poradit.

A teď už nám jenom zbývá nastavit proudy dat z H3.0 do GBQ

H3.0 -> GBQ

V modulu Administrace/H3.0METRICS se nastavují takzvané DataTasky, tedy úkoly pro H3.0, aby posílalo nějaká data jinam. V našem případě nastavíme 3 datatasky pro posílání Kampaní celkem, Placementů celkem a Placementů po dnech, pokaždé do jiné tabulky v GBQ, kterou jsme si předtím nastavili.

Klikněte na tlačítko Vytvořit nový DataTask

V okně, které se otevře je možné DataTask nastavit. Je tam toho hodně, ale to nejdůležitější co potřebujete je:

  1. Zdroj dat vyberte jako H3.0: Campaigns and Placements
  2. Cílové propojení vyberte ten login, co jste si teď zadali
  3. Vyberte Typ dat podle toho, jaká data chcete posílat (Kampaně celkem, Placementy celkem, Placementy po dnech)
  4. Do Tabulka vyplňte název patřičné GBQ tabulky pro daný Typ dat. POZOR!! ve formátu dataset.table, tedy pro náš příklad třeba “H30metrics.h30campaignstotal”
  5. Můžete si kliknout na tlačítko Test cílového propojení, abyste zjistili, že máte loginy i Tabulku napsané správně
  6. Zaškrtněte Vyprázdnit tabulku před každým vložením dat
  7. Nastavte správně Frekvenci spouštění, pokud chcete každý den v nějakou hodinu, musí být v DAY, MONTH i WEEKDAY hvězdička a v MINUTE a HOUR patřičná hodina a minuta dne v kolik se to má spouštět
  8. Pro úvodní odlaďování si nechte Odesílat reporty jak po úspěšném, tak po neúspěšném provedení
  9. Nastavte správný datum Od a Do, pro vhodný časový úsek dat, která se budou posílat.

Klikněte na Save a nyní jenom zbývá počkat, až nastane patřičný okamžik, který jste nastavili v Data Tasku, aby se spustil.

Pokud byste nechtěli čekat, můžete Data Task spustit ručně kliknutím na tlačítko Spustit v řádku DataTasku v seznamu DataTasků.

Pozor – DataTasky se spouštjí “asynchronně”, tedy může trvat, než doběhnou, i když se vám třeba může zdát, že už proběhly. Výsledek toho jak DT proběhlo je v pravých sloupcích tabulky se seznamem DataTasků

A co dál? Můžete si vytvořit vlastní dashboard s daty z H3.0, například v Looker Studio (bývalé Google Data Studio).