Статистика по большому количеству полей

Ivan Pomidorov 26.03.2013 21:06

Какого рода статистика нужна?

p.s. Слышал что в хибернейте есть пакет statistics, но он скорее всего для мониторинга/профилирования.

Відповісти

Підтримати

Bogdan Shyiak SE or Dev 26.03.2013 21:10

Какого рода статистика нужна?

Статистические функции:

всякие средние, моды, медианы

+ персентили и тд. Каждый столбец в базе — это выборка.

Слышал что в хибернейте есть пакет statistics,

Если вы про org.hibernate.stat — то это совсем про другое.

Відповісти

Підтримати

Ivan Pomidorov

Alexandr Gavriluk 26.03.2013 19:20

Возможно не понял вопрос, а чем плохо написать один враппер, который будет по имени таблицы и имени поля и текста условия генерировать запрос и выдавать массив с данными, который можно подставить в функцию. Или тебе нужно одновременно считать по всем 20 полям?

PS
поля одного типа или разных?

Відповісти

Підтримати

Bogdan Shyiak SE or Dev 26.03.2013 19:32

Возможно не понял вопрос,

Попробую кодом

class A {
 int f1;
 int f2;
…
 int f20;
}

Надо получить:

class A {
 int avg(f1);
 int avg(f2);
…
 int avg(f20);
}

То есть среднее (или какую-то другую статистику по каждому полю). Переупаковать это в json и отправить на клиент. Там уже рисовать по этим данным картинки (по факту бары от fi до fj).

враппер, который будет по имени таблицы и имени поля и текста условия генерировать запрос и выдавать массив с данными, который можно подставить в функцию

Но чтобы заполнить все 20 полей, надо будет руками вызвать этот 20 раз.

поля одного типа или разных?

Наллебл инты.

Відповісти

Підтримати

Alexandr Gavriluk

Alexandr Gavriluk 26.03.2013 19:44

Если можно считать в серверном коде(MySQL-вскими процедурами будет сложнее), то просто пишешь:
1. генератор кода, который по списку полей, таблице, и условию генерирует запрос в базу.
2. парсер который переведет рекордсет в массив массивов 2D таблицу
3. процедуру в которую передается 2D таблица данных и ссылка на функцию (неважно как реализовать, можно даже через интерфейс), в результате парсер передает в эту функцию каждый столбец и считает данные функции.
4. в результате шага 3 получаем 1D массив уже медиан/среднего или пр
5. пакуем в xml/json

А далее оформляем эту всю приблуду в одну суперфункцию, где на входе, список полей, таблица и условие а на выходе json

Відповісти

Підтримати

Bogdan Shyiak

Bogdan Shyiak SE or Dev 26.03.2013 19:53

Если можно считать в серверном коде

Не хотелось бы.

4. в результате шага 3 получаем 1D массив уже медиан/среднего или пр
5. пакуем в xml/json

И массив метаинформации. А в объект как паковать? Хотелось бы обойтись без черной магии (в своем коде) и руками создавать объект не хочется. Основная мотивация: хочется упростить рефакторинг кода и сохранить поддержку ИДЕ.

Відповісти

Підтримати

Alexandr Gavriluk

Alexandr Gavriluk 26.03.2013 20:43

так вы бы сами написали, что основная проблема — это создание объекта с произвольным количеством полей.

Хотя функционально, ассоциативный массив не хуже.
php.net/...json-decode.php

Поп поводу расчета на sql сервере — можно использовать динамический SQL
delimiter // CREATE PROCEDURE dynamic(IN tbl CHAR(64), IN col CHAR(64)) BEGIN SET @s = CONCAT('SELECT ',col,' FROM ',tbl ); PREPARE stmt FROM @s; EXECUTE stmt; END // delimiter ;

А далее mysql_fetch_object и получаете объект.

Відповісти

Підтримати

Bogdan Shyiak

Bogdan Shyiak SE or Dev 26.03.2013 20:57

так вы бы сами написали, что основная проблема — это создание объекта с произвольным количеством полей.

Нет. Проблема перепаковать и поддерживать добавление колонок в базу и поля в объект (класс)

Хотя функционально, ассоциативный массив не хуже.
php.net/...json-decode.php

Это к чему? 1) Это не пхп. 2) Хотелось бы получить рефакторинг. 3) Хотелось бы автоматический маппинг при записи в базу.

Відповісти

Підтримати

Alexandr Gavriluk

Alexandr Gavriluk 26.03.2013 21:05

Нет. Проблема перепаковать и поддерживать добавление колонок в базу и поля в объект (класс)

Тогда вам искать фрейворк-враппер над рефлекшеном.

Відповісти

Підтримати

Bogdan Shyiak

Bogdan Shyiak SE or Dev 26.03.2013 21:10

Тогда вам искать фрейворк-враппер над рефлекшеном.

Спсыбо, Кэп :)

Відповісти

Підтримати

Alexandr Gavriluk

proger 26.03.2013 20:37

Но чтобы заполнить все 20 полей, надо будет руками вызвать этот 20 раз.

ну все зависит что стоит в where /group by
если там одинаковые условия, то никто не запрещает вызвать один раз
SELECT AVG(f1), AVG(f2) ...

Відповісти

Підтримати

Bogdan Shyiak

Bogdan Shyiak SE or Dev 26.03.2013 20:43

если там одинаковые условия, то никто не запрещает вызвать один раз
SELECT AVG(f1), AVG(f2) ...

А данные на объект как замапить? И что делать когда появится 21-е поле? Править селект, править код который подготавливает данные (по своей сути данные — это мапа).

Відповісти

Підтримати

proger

proger 26.03.2013 20:48

ну я бы запрос генерил бы, вот мне делать нечего писать двадцать штук AVG руками :)
а количество полей можно наверное как-то конфигом оформить

Відповісти

Підтримати

Bogdan Shyiak

Bogdan Shyiak SE or Dev 26.03.2013 20:59

ну я бы запрос генерил бы, вот мне делать нечего писать двадцать штук AVG руками :)

О и я об этом же :) Вопрос как? Без рефлекшена. И мапить потом их как?

Відповісти

Підтримати

proger

proger 26.03.2013 21:17

без рефлекшена никак, хотя ... может java сможет, а вас устроит ассоциативный массив имя-значения, аля пшп

Відповісти

Підтримати

Bogdan Shyiak

Bogdan Shyiak SE or Dev 26.03.2013 21:24

а вас устроит ассоциативный массив имя-значения, аля пшп

Да, но если просто использовать мапу, то надо писать маппинг на БД руками + нима поддержки ИДЕ.

Відповісти

Підтримати

proger

proger 26.03.2013 20:42

ну и если это чет серьезное, я сделал бы промежуточные таблицы в базе, и обновлял бы их по крону или по событию (можно даже на сервере считать), а клиент бы просто обращался к промежуточным таблицам
заодно это бы решило бы проблему пиковых нагрузок, всетаки агрегатные функции недешевы

Відповісти

Підтримати

Bogdan Shyiak

Bogdan Shyiak SE or Dev 26.03.2013 20:47

ну и если это чет серьезное,

В том то и дело что не серьезное. Выборки будут относительно редкие. И хотелось бы как можно меньше писать кода. Хочется максимальной простоты, но все что могу придумать это или работа с сырыми данными (руками запросы, руками сереализация в джсон) или макросы/рефлекшн.

Відповісти

Підтримати

proger

Alexandr Gavriluk 26.03.2013 20:48

Собственно да, такой себе кеш запросов, процесс на сервере, который проверяет устаревание данных и генерирует новые в зависимости от пула запросов с клиента.

Відповісти

Підтримати

proger