Re: vykreslování grafů z velkého množství dat
Petr Labaj
labaj na volny.cz
Neděle Prosinec 8 23:56:48 CET 2024
Přijde mi to hodně dat a hodně rychle na to, aby se používaly nějaké
univerzální prostředky a postupy.
Je to přes 1.2 miliardy řádků. To už je (podle mě) hodně na to, aby se
plýtvalo místem na nějaký neúsporný textový formát dat, který znamená
nárůst proti syrovým datům aspoň na 4-násobek.
Navíc frekvence zápisu 2kHz možná může být už na PC s Windows s jeho
latencemi občas moc.
Já bych tam strčil nějaký ESP32 nebo něco podobného, který by to sbíral
tou rychlostí 2kHz a posílal do PC třeba jednou za sekundu nebo třeba 10
sekund.
V nějakém proprietárním úsporném formátu.
A vyhodnocení nad tím si udělat uživatelsky.
Trochu mi uniká jak v grafu s miliardou 4-položek budete očima něco
hledat. Na to je snad lepší nějaké předzpracování procesorem, který
vyrobí průměry a označí maxima nebo jinak významné body a tak.
Připadá mi to jako jednoznačný kandidát na nějaké specializované
zpracování. Ne na nějaký Excel nebo jiný univerzální nástroj.
Když už univerzální nástroj, tak pak nějakou TSDB (Time series database)
a nad tím pak nějaký nástroj typu Grafana.
PL
*******************
Dne 8.12.2024 v 12:30 Vláďa Anděl napsal(a):
>
> Dobrý den,
>
> zase mám volněji a zabývám se myšlenkou na dataloger. Celkem běžně
> používaný formát zápisu je textový csv, na každém řádku datum, čas a
> neměřené hodnoty. Dá se to naimportovat do excelu (calcu). Jenže tam
> je počet řádků omezený na 2^20 a vždycky jsem si říkal, jak je ten
> calc pomalý. Tady jsem si přečet vysvětlení
> https://ask.libreoffice.org/t/kdy-bude-zvetsen-maximalni-pocet-radku/62648
> že vlastně ta buňka neobsahuje jen to číslo, které jsem do ní vložil,
> ale má spoustu dalších vlastností, což pak nejen žere paměť, ale
> zpomaluje jakoukoliv manipulaci - třeba vykreslení grafu.
>
> Co bych potřeboval - vzorkovací kmitočet 2 KHz a dobu záznamu aspoň
> týden. Milion řádků v excelu by bylo 500 vteřin záznamu, to by bylo
> strašně rozkouskované. Potřebuju zapisovat dva kanály (napětí, proud)
> a tak mě napadlo použít formát wav souboru. Zapíše se hlavička a pak
> už se tam hrnou data dva bajty levý, dva bajty pravý. Audacity s
> velkým balíkem dat umí, dokáže hledat maxima (o ty mi právě jde), jen
> nevím, jestli vezme vzorkování 2 KHz. Ale jde jen o měřítko času, není
> to až tak zásadní. Problém je tam v tom, že graf nemá nějaké rozumné
> měřítko. Vidím sice průběh, ale jsou tam čtyři čárky na celý rozsah.
>
> Je něco jiného na zobrazení tak velkého balíku dat, aby to ukazovalo
> nějaké rozumné měřítko a aby tam bylo případně i nějaké kurzorové
> odměřování? Pokud možno free? Taky si to mohu celé zhruba zobrazit v
> audacity a pak jen ty vybrané kousky vystříhnout, uložit jako wav,
> převést do csv a zobrazit v excelu. Lepší by bylo, kdyby to nějaký
> nástroj uměl přímo.
>
> Anděl
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <http://list.hw.cz/pipermail/hw-list/attachments/20241208/21734be4/attachment.htm>
Další informace o konferenci Hw-list