Подскажите инструмент для построения отчетов

Підписуйтеся на Telegram-канал «DOU #tech», щоб не пропустити нові технічні статті

Привет

Кто подскажет базу данных и инструмент для построения отчетов если размер базы будет порядка миллиарда записей?

Речь идет о сборе статистики по ответах на вопросы для школьников. Они будут сдавать тесты (20 вопросов типа multiple choice). Тесты будут сдавать несколько раз в году (например 5 раз). Колличество студентов 3 миллиона. И тесты будут сдавать на протяжении 5 лет.

Нужно будет:
1. Хранить эти данные где-нибудь
2. Строить отчеты по результатам (колличество набранных баллов, проценты правильных ответов) индивидуальных школьников, их классов, школ, учителей.

Пожалуйста подскажите существующие решения для такой проблемы, чтоб не писать свой велосипед.

С уважением,
Юрий

👍ПодобаєтьсяСподобалось0
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Выбор остановил на Amazon RDS и Tableau.

А дані будуть відкритими?

Посмотрите в сторону Zoomdata — там почти к любой популярной БД можно подключить + скорость космос

спасибо за совет. Обязательно посмотрю

Посмотрел Ваш профайл(у Вас скилов как у бродячей собаки блох)- чет он как то плохо гармнонирует с вопросом который Вы задали: такое впечатление что Вы как то слабо себе представляете разработку в принципе)))

Удивительно слышать такое от Вас))

С чего, простите, мои речи сталли Вас удивлять? )

Вчера Вы были куда терпимее к окружающим))

Не выспался, а тут «Архитектор» )

А «SEO» Вы симпатизируете больше?)

Ну не все, не все)) Вчера вот был пример)

Элементарно: никто не строит отчётов по сырым данным. Хотя количество «3 миллиона» в принципе тривиальное для современных баз данных. Но когда тесты уже сданы, ты тупо собираешь по ним статистику, в несколько РАЗНЫХ таблиц, с группировкой по нужным полям — и только их даёшь на выход. Суть в том, чтобы убрать из таблицы персональные данные как таковые.

Но так решают в боевых проектах. В учебном — лучше не заморачивайся, это никому не надо, тебя попросту не поймут: сами преподаватели далеки от боевых задач, им третью нормальную форму подавай. В твоём случае — тупо присоединись к базе от сводной таблицы Excel или другого OLAP на твой выбор, через ODBC или другой драйвер который твоя OLAP поддерживает — и в бой.

Под базу возьми MySQL — большего здесь не требуется. Основная таблица — это ID теста, ID вопроса, номер вопроса (заметь, что он отрывается от таблицы вопросов, и целостность номера более не поддерживается), текст вопроса, текст ответа, правильный ответ (для боевого проекта сие важно).

Для ХРАНЕНИЯ ответа я бы не использовал множественные строки, а только одну — строка, разделённая запятыми, если вопросы числовые. Почему так: достаточно легко распарсить программно, а сравнение с правильным производить тупо сравнением строки. В строке ты перечисляешь ID ответа, а не их номер: это важно. Потому что когда полезут править вопрос задним числом, если какие-то ответы будут удаляться (скрываться!) не слетала правильность ответа у того, кто уже его дал. Выбор именно строки диктуется тем, что на некоторые вопросы нужно будет дать текстовый ответ. Кстати, не забудь там запятые экранировать — может быть такое, что ответ и числовой, и текстовый. Можешь хранить как JSON-строку.

Я так понимаю, дипломная работа, да :)
Но в этом случае тебе самому придётся писать эту туеву хучу объяснений всего, что ты делаешь. Или тому у кого ты её в итоге закажешь. Мой совет — если будешь заказывать на стороне, закажи сейчас. Потому что дедлайн уже сейчас, ты тупо не втолпишься, и цену заломят, и сроки сорвут. А всё говорит о том, что будешь — на календарь посмотри. Вариант что за тебя доделают — не рассматривай в принципе, доделать стоит дороже чем с нуля.

«На некоторые вопросы нужно будет дать текстовый ответ »
И как Вы собираетесь такие ответы сравнивать? Вы представляете что там можно «наотвечать»?

Текстовые ответы оцениваются людями. Иногда людьми.
Если реализация самого контента качественная, то наверняка есть вопросы типа «выберете правильные ответы» и ниже поле «объясните почему вы так думаете». Это требуется всем наукам гуманитарного цикла, коих большинство. А тесты как правило именно гуманитариям полезны.

вы задаете такие вопросы что не понятно как вас к этому проекту подпустили. Я бы вас сразу выгнал )))
нужны такие еще детали
— как эти данные вы будете заносить
— какая будет при этом типичная\пиковая нагрузка
Я так понимаю это будет плюс минус одновременно так что могут быть разные интересные моменты с точки зрения инфраструктуры

Підписатись на коментарі