/pr/ - Универсальный баз данных тред #11

Универсальный баз данных тред #11 /sql/ Аноним 10/09/24 Втр 00:01:10 № 3268780 1

Прошлый >>3122886 (OP)

Ссылки:
- https://www.postgresqltutorial.com/
- https://www.mysqltutorial.org/
- https://www.sqlitetutorial.net/
- https://www.oracletutorial.com/
- https://github.com/agarcialeon/awesome-database

Задачи:
- https://www.sql-ex.ru
- https://www.codewars.com/?language=sql

Продвинутый MySQL:
- https://www.mysqltutorial.org/mysql-resources.aspx
- https://shlomi-noach.github.io/awesome-mysql/

Инструменты проектирования БД
- https://www.mysql.com/products/workbench/
- https://explain.dalibo.com/

Видосики:
- Плейлисты по разным СУБД: https://www.youtube.com/c/SQLDeveloperBI/playlists
- https://www.youtube.com/playlist?list=PLY7PmJJFH5nT-lbFKxfbp3rw5BBuq5Azo

Литература:
- Томас Кайт. Oracle для профессионалов
- https://postgrespro.ru/education/books/dbtech
- Алан Бьюли. Изучаем SQL. - про MySQL
- К. Дж. Дейт. Введение в системы баз данных
- Database Systems: Design, Implementation, & Management (Carlos Coronel, Steven Morris)

Прочее:
- https://dbdb.io/
- https://db.cs.cmu.edu/
- https://www.youtube.com/channel/UCHnBsf2rH-K7pn09rb3qvkA/playlists
- Сравнение диалектов SQL: http://troels.arvin.dk/db/rdbms/
- Как БД работают изнутри: https://habr.com/ru/company/mailru/blog/266811/

Ссылки для альтернативно мыслящих:
- https://www.w3schools.com/sql/
- https://learnxinyminutes.com/docs/sql/
- https://metanit.com/sql/
- http://sql-tutorial.ru/
- https://metanit.com/nosql/mongodb/

FAQ:
Q: Нужно ли знать английский?
A: Нет.

Q: Что лучше, SQL или NoSQL?
A: SQL.

Q: Вопросы с лабами и задачками
A: Задавай, ответят, но могут и обоссать.

Q: Помогите с :ORM_нейм для :язык_нейм
A: Лучше спроси в тредах по конкретным языкам.

Q: Где хранить файлы?
A: Не в БД. Для этого есть объектные хранилища, такие как Amazon S3 и Ceph.

Здесь мы:
- Разбираемся, почему PostgreSQL - не Oracle
- Пытаемся понять, зачем нужен Тырпрайс, если есть бесплатный опенсурс
- Обсуждаем, какие новые тенденции хранения данных появляются в современном цифровом обеществе
- Решаем всем тредом лабы для заплутавших студентов и задачки с sql-ex для тех, у кого завтра ПЕРВОЕ собеседование
- Анализируем, как работает поиск вконтакте
- И просто хорошо проводим время, обсирая чужой код, не раскрывая, как писать правильно.

Поехали!

Аноним 13/09/24 Птн 13:14:36 № 3271750 2

Всем настолько поебать,что за три дня ни одного поста?

Аноним 13/09/24 Птн 21:36:02 № 3272255 3

>>3271750
Это чисто утилитарный тред, здесь пишут, когда есть вопросы, а не когда хотят початиться.

Аноним 15/09/24 Вск 18:29:26 № 3273514 4

>>3272255
У этого треда активность как у любого другого на этой доске - околонулевая. Даже если человек задает вопрос, этот вопрос может висеть день и больше. Зато соседний тред, в котором айтишники могут повнимаеблядствовать, +- живой.

Аноним 18/09/24 Срд 19:56:20 № 3276114 5

Куда можно вкатиться с уверенным знанием MS SQL (1.5 года работы+), посредственным знанием питона (простенькие парсеры, работал с апи немного) ,и павер би(пара отчетов буквально было на PBI) . Думал в аналитику уйти, но там хуй поймешь требования, везде разные стэк требуют.

Аноним 21/09/24 Суб 15:55:08 № 3278138 6

>Q: Что лучше, SQL или NoSQL?
>A: SQL.
поясните для тупых

Аноним 21/09/24 Суб 17:39:50 № 3278205 7

>>3278138
Ну ты вообще.
SQL - это Structured Query Language. Есть в природе база в которой не используется язык запросов и у запросов нет никакой структуры?

Вот тебе и вывод: иметь язык запросов с понятной структурой лучше чем не иметь.

Аноним 21/09/24 Суб 17:56:20 № 3278218 8

>>3278205
>у запросов нет никакой структуры
что имеется ввиду под структурой запросов?

Аноним 21/09/24 Суб 19:54:22 № 3278312 9

>>3278218
Что значит "что"?

Аноним 21/09/24 Суб 19:55:10 № 3278315 10

>>3278138
>поясните для тупых
Это личное мнение какого-то петуха. Всё зависит от конкретного сценария использования. Есть сценарии когда лучше взять SQL и есть сценарии когда NoSQL лучше. Надо разбирать по каждому отдельному примеру. У меня есть и такие проекты и сякие. В том числе и NoSQL-проекты. И никто не умер от этого. Ничего такого сверхкритического нет. Ну да, в чём-то удобнее, а в чём-то неудобнее. В чём-то лучше, а в чём-то хуже. Где-то быстрее, а где-то медленнее. Можно до бесконечности обсасывать "ааааа, а вот у вас запись на 10% медленнее!" Есть случаи, когда одновременно и NoSQL и SQL в одном проекте используется, один для аналитики, а вторая БД для скорости. Такое тоже бывает.

Аноним 21/09/24 Суб 20:01:09 № 3278326 11

17003988129030.webm 4719Кб, 640x360, 00:01:24

>>3278315
Это жпт паста?

Аноним 21/09/24 Суб 20:36:04 № 3278370 12

>>3278315
>Есть случаи, когда одновременно и NoSQL и SQL в одном проекте используется
Это когда основная БД нормальная реляционка но тимлид пропихнул в проект монгу для одного сервиса чтобы у себя в резюме потом написать NoSQL, MongoDB

Аноним 21/09/24 Суб 20:52:40 № 3278380 13

>>3278370
Да-да, так всё и было. Невыдуманная история о которой невозможно молчать.

>>3278326
>Это жпт паста
Давай в ебальник тебе заряжу, если ты ёбнешься с ног тогда я не паста.

Аноним 21/09/24 Суб 21:09:31 № 3278385 14

>>3278312
>пук
ясн

Аноним 21/09/24 Суб 21:58:06 № 3278398 15

Замечаю в последнее время большой хайп по локальным решениям для "не-распределенной обработки данных с высоким перформансом". Polars, Dask, Ray, DuckDB, и т.д.
Кто-нибудь может объяснить мне, какие задачи у этой ебалы? В моей голове, если хочется поиграться локально с данными (будь то для локальной разработки, или же если ты аналитик и у тебя адхок задача) - есть Pandas для питонистов, есть SQLite для сиквела. Если же надо большие данные - есть жирные реляционные БД, есть всякие распределенные решения на мапредюсе, всё это можно захостить в облаке или онпрем. А вот этот класс инструментов - нафига он?
У меня есть ощущение что это вышло из DS, где люди так или иначе работают на жирных ноутах и модельки локально обучают, но ХЗ, я не машобщик.

Аноним 21/09/24 Суб 23:05:59 № 3278435 16

>>3278385
что имеется ввиду под пук?

Аноним 21/09/24 Суб 23:18:01 № 3278450 17

17164831276380.mp4 1607Кб, 1920x1080, 00:00:11

>>3278380
А чего ты порвался? У того, как ты выразился "петуха", хотя бы мнение какое-то было. А хули проку с твоего абзаца воды? Пук среньк, так-то да, а так-то нет.

Дженерик переливание из пустого в порожнее, один в один как жпт кал. Когда надо что-то высрать, но ничего конкретного ты не знаешь. Только жпт так запрограммирована чтобы всегда высирать ответ, а ты нахуя тут насрал?

Аноним 21/09/24 Суб 23:41:49 № 3278463 18

>>3278435
то, что ты обосрался

Аноним 22/09/24 Вск 00:04:58 № 3278474 19

>>3278450
Да не хочу я в ваших тупорылых спорах участвовать. Рассказывать по делу это с пеной у рта доказывать, что nosql пиздец хуже чем sql и вообще nosql нигде не применяется? Да иди ты нахуй и все кто доказывают эту хуйню - идите нахуй. Есть примеры когда nosql + sql используются одновременно, есть даже такой паттерн, называется CQRS:

https://highscalability.com/sql-nosql-yes/
https://www.thereformedprogrammer.net/ef-core-combining-sql-and-nosql-databases-for-better-performance/

Обе бд имеют право на существование.

Аноним 22/09/24 Вск 00:19:54 № 3278481 20

>>3278370
Не обязательно так. У нас сейчас на проде одного довольно ебучего легаси продукта MySQL и Монга. Изначально был только мускуль, но продукт очень быстро разросся и требовал HA, так что мускуль заскейлить под эти требования не получалось. В итоге конфиги остались в мускуле, а основные OLTP в монге. Это в принципе неплохо работает.

Аноним 22/09/24 Вск 00:25:28 № 3278484 21

>>3278481
>MySQL
Эт че?

Аноним 22/09/24 Вск 00:58:30 № 3278495 22

>>3278474
Опять какая-то вода, бессмысленный мусор. Право на существование блядь какое-то, филосов стекломойный.

Если человек спрашивает что выбрать, то выбирать ему нужно реляционную базу. Без вариантов. Потому что данные будут в целости, сохранности и в нормальном виде. И перейти с реляционной базы на любую другую - легко. А вот обратно - хуй.

А рассказывать про какие-то охуительные исключения можно до бесконечности, только практической пользы от таких рассказов нихуя нет.

Аноним 22/09/24 Вск 01:14:45 № 3278501 23

>>3278495
>Если человек спрашивает что выбрать
Выбирается в зависимости от задачи. Взвешиваются все плюсы и минусы. У меня есть проекты на nosql, там где сложные запросы не требуются. Никто не жаловался. И есть проекты на постгре. Если ты не можешь сделать на nosql - проблема в тебе и в кривых руках растущих из жопы.

Аноним 22/09/24 Вск 01:39:59 № 3278504 24

>>3278501
Согласен, все по факту.
Выбирается постгрес потому что он способен решить большинство задач, и для него достатоно иметь немного кривые руки растущие из жопы. Он не даст сделать полной хуйни и обойдет за тебя большинство подводных камней.

Постгрес - вариант беспроигрышный. Пишешь в постгрес по умолчанию, а потом уже взвешиваешь плюсы и хуюсы и решаешь что делать дальше. Спойлер: в 99% случаев нихуя делать и не надо.

Аноним 22/09/24 Вск 04:44:18 № 3278512 25

>>3278501
>где сложные запросы не требуются
Сперва не требуются, а потом внезапно хуяк и потребовались. Стартап выстрелил, так иногда бывает. И начинаются анальные пляски с кучей баз каждая в своем микросервисе, по сети летают данные там, где хватило бы обычного запроса на десяток джоинов. В какой-то момент происходит пиздос, данные разъезжаются и вместо холодильника с маркетплейся приезжает коробка дилдаков. Зато не sql.

Аноним 22/09/24 Вск 08:07:12 № 3278531 26

>>3278512
Когда стартап выстреливает - пока мвп лениво крутится в проде набирается команда и переписывается всё чуть ли не с нуля, но по уму. На стадии мвп и поиска инвесторов очень многое, как в коде, так и в инфре нахер не нужно и не делается.

И сделать выгрузку из одной базы для переноса в другую - обычная задача, сто раз уже пройденная многими тысячами разрабов с написанием гигабайтов гайдов.

Аноним 22/09/24 Вск 08:59:54 № 3278547 27

>>3278531
Твои бы слова да в авито. Команду так просто не соберешь, если ты не гугл. Главкабан не понимает, почему надо просрать кучу бабла и получить точно такой же продукт. Чтобы что? Продукт уже есть, надо набрасывать новые фичи с лопаты.

Аноним 22/09/24 Вск 13:19:13 № 3278695 28

>>3278547
этот шарит

>>3278531
этот безработный шиз идеалист эскуэль сектант

Аноним 22/09/24 Вск 14:05:43 № 3278714 29

>>3278512
Ой бля хорош нудеть нахуй. Ты как бабка авдрухчо. Зачем писать а вот если то произойдёт, то чё тогда? Ну произойдёт и произойдёт. Что-нибудь придумаю, поставлю вторую бд или дата лейк замучу, или будет какая-нибудь pre-aggregate функция. Ситуаций из которых прям никак не выкрутиться почти не бывает. Нуууу блять всё можно грамотно обыграть, это не конец света.

Аноним 22/09/24 Вск 15:17:41 № 3278744 30

>>3278714
>Нуууу блять всё можно грамотно обыграть
И поэтому все всё грамотно обыгрывают и у всех все заебись.

Аноним 25/09/24 Срд 20:41:09 № 3281434 31

(PostgreSQL) Есть сущность с 16 байт ключом и двумя десятками опциональных атрибутов, из которых треть - text. Большинство запросов - чтение всех атрибутов, и обновление одного-двух атрибутов. Записей - десятки миллионов. Стоит выбор между одной широкой таблицей с NULL колонками, и двумя десятками таблиц, по одной на каждый опциональный атрибут.
Что стоит выбрать и почему? Есть ли преимущество у таблиц с исключительно фиксированной длиной всех колонок?

Аноним 25/09/24 Срд 21:55:41 № 3281487 32

>>3281434
Жсон

Аноним 26/09/24 Чтв 09:14:42 № 3281669 33

Я джун с 0 опытом работы.
Умею выполнять простые-средние SQL-запросы.
Мне нужно составить знание что я должен делать, куда смотреть, что вводить, какими критериями руководствоваться, какими инструментами пользоваться, чтобы научиться анализировать и оптимизировать работу с mysql. Книги, материалы, темы может кто-нибудь подсказать для этой ситуации?

Аноним 26/09/24 Чтв 10:38:31 № 3281754 34

>>3281487
>Жсон в реляционной базе данных.
Это какая нормальная форма?

Аноним 26/09/24 Чтв 18:27:33 № 3282212 35

>>3281754
Самая нормальная

Аноним 03/10/24 Чтв 21:38:03 № 3288594 36

>>3281669
сам тоже джун, пока смотрю этот плейлист https://youtube.com/playlist?list=PLUaB-1hjhk8FE_XZ87vPPSfHqb6OcM0cF&si=_HI7RFCllbmwDXBN. вроде норм, только видео все на английском, если с ним проблема, то яндекс озвучивание видео в помощь

Аноним 11/10/24 Птн 07:20:31 № 3295058 37

Сап, аноны
Решил тут sql академию пройти и залип на задачке с insert
Добавьте новый товар в таблицу Goods с именем «Table» и типом «equipment».
В качестве первичного ключа (good_id) укажите количество записей в таблице + 1.
3й аргумент можно просто указать, но хочется его получить, а я не пойму как.

Написал решение:
insert into goods (good_id, good_name, type) values(
count(good_id) + 1,
'Table',
(ifnull(
select max(good_type_id) from GoodTypes where good_type_name = 'equipment'
group by good_type_id, 0)))

Думал через селект выдернуть можно, не получилось, попробовал через ифналл, но и он не сработал.
Что можно применить?

Аноним 11/10/24 Птн 07:48:36 № 3295068 38

>>3295058
А блин. Затупил.
Надо было вместо велъюс использовать селект

Аноним 11/10/24 Птн 22:44:58 № 3295816 39

clown-academy.mp4 2542Кб, 700x700, 00:00:23

>>3295058
>sql академию
>В качестве первичного ключа (good_id) укажите количество записей в таблице + 1.
Охуительная академия.

Аноним 12/10/24 Суб 07:09:43 № 3295938 40

>>3295816
Что не так? Порядковый номер - это вполне реальный натуральный ключ. Или ты предлагаешь заменить натуральный ключ автоинкрементом? Почему?

Аноним 12/10/24 Суб 08:41:54 № 3295957 41

16507308835530.webm 9167Кб, 320x240, 00:03:19

>>3295938
>натуральный ключ
Ты совсем ебанулся? Что за шизофазию ты несешь?
Какой он нахуй натуральный если вычисляется на лету, да еще и зависит от состояния ВСЕЙ таблицы, которое меняется постоянно?

Вот удалить запись с айди, например, три. И кто тут теперь вполне натуральный, кто тут блядь порядковый? Кто пятый? Кто десятый? А новый порядковый номер какой будет? Такой же как предыдущий?
И это я не говорю про вставку записей. Там же блядь гонка будет перманентная. Каждый долбоеб пересчитывает записи, а пока он считал там новые добавились.

Даже не знаю с кого я больше охуеваю. С клоунов-академиков или с клоунов-двачеров.

Аноним 12/10/24 Суб 09:03:58 № 3295961 42

>>3295957
>зависит от состояния ВСЕЙ таблицы
Не зависит.
>Вот удалить
Дальше не читал.

Аноним 12/10/24 Суб 09:07:38 № 3295962 43

16884917041260.webm 422Кб, 480x360, 00:00:07

>>3295961
>укажите количество записей в таблице + 1
>Не зависит.

Аноним 12/10/24 Суб 11:30:01 № 3296021 44

>>3295962
Да ладно, все такими были. Сейчас он разберется и поймет свою ошибку. Или не поймет и пойдет работать в яндекс, там умные не нужны.

Аноним 13/10/24 Вск 16:57:37 № 3297145 45

Привет аноны.

Что у вас спрашивают на собесах? Что сами спрашиваете?

Надо собеседовать маслят накидайте что-нибудь.

С меня как обычно нихуя

Аноним 13/10/24 Вск 19:03:03 № 3297279 46

>>3297145
По описанию логической модели данных напиши создай (напиши в DML) таблицы в 6NF, затем 5NF вьюшки для "основных" таблиц, и пару-тройку процедур для ввода данных. Создай индусы для процедур. Если осталось время, то опиши роли и права для администратора, пользователя, и приложения.

Аноним 14/10/24 Пнд 08:56:35 № 3297514 47

>>3297279
>таблицы в 6NF
Зачем это? Выше 3нф редко бывает нужно на практике, а чаще всего одну жирную таблицу вообще дробят на много маленьких и хранят жсоны в базе, потому что так быстрее работает и ниибёт.

Аноним 14/10/24 Пнд 09:19:45 № 3297535 48

>>3297514
>Выше 3нф редко бывает нужно на практике
Потому что на практике большинство таблиц в 3NF на самом деле удовлетворяют 5NF или 6NF.
>одну жирную таблицу вообще дробят на много маленьких и хранят жсоны в базе, потому что так быстрее работает и ниибёт.
Что работает быстрее?

Аноним 14/10/24 Пнд 09:42:52 № 3297549 49

>>3297535
>Что работает быстрее?
Ты глупый?

Аноним 14/10/24 Пнд 10:51:44 № 3297606 50

>>3297279
спасибо анон, но звуит душновато. Хотя тот же 6NF довольно часто используется, но я б не стал так вопрос формулировать.

Я обычно спрашиваю, как работает жоин на физическом уровне, чем отличается кластерный индекс от не кластерного. Рисовать таблички не заставляю, могу спросить про CDC/SCD.

Аноним 14/10/24 Пнд 11:52:10 № 3297662 51

>>3297606
>как работает жоин на физическом уровне
В какой версии движка для какой субд?

Аноним 14/10/24 Пнд 12:31:04 № 3297691 52

>>3297606
>как работает жоин на физическом уровне
Где об этом можно почитать?

Аноним 14/10/24 Пнд 16:39:51 № 3298023 53

>>3295816
Просто учебный пример, потом генерация id будет, надеюсь

Аноним 14/10/24 Пнд 17:50:33 № 3298116 54

>>3297662
я имeл в виду про hash\loop\merge

Аноним 14/10/24 Пнд 19:19:38 № 3298215 55

>>3297691
Зачем? У промышленных субд внутри происходит ебаная магия с патентованными алгоритмами. Алсо сама концепция декларативного sql говорит, что тебе должно быть похуй на реализацию. Вопрос из серии "к чему бы еще доебаться".
Туда же вопросы про кластерный-некластерный индекс. Все индексы некластерные, блять, а кластерный только один по id, нахуя уделять ему столько внимания?

Аноним 14/10/24 Пнд 20:35:25 № 3298274 56

>>3298215
буднешь смеется, мне не давно началит рассказывать что кластерный ПОТОМУШО ДАННЫЕ ХРАНЯТСЯ В НЁМ КЛСТЕРОМ.

Аноним 14/10/24 Пнд 23:51:53 № 3298381 57

Мужики, прошу помощи на коленях

Вот есть древовидная структура у меня в базе
Ко мне приходит последовательность зависимости от корня к листу. Как проверить что эта последовательность есть в бд?
Не понимаю как использовать тут рекурсивный запрос

Аноним 15/10/24 Втр 00:48:20 № 3298400 58

>>3298381

Час потужной мысли и гугления, теперь я вывожу путь от листа до корня в массив и возвращаю
В целом - это уже что-то

Аноним 15/10/24 Втр 02:27:34 № 3298425 59

>>3298381
>>3298400
А тебе не приходилов голову просто сделать запрос WHERE parent_id IN(твоя последовательность)? Зачем тебе вообще здесь рекурсия? Рекурсия нужна чтобы ПОСТРОИТЬ дерево, а утебя дерево на вход подается, нужно только убедиться что ноды из этого дерева в базе есть.

Аноним 15/10/24 Втр 14:39:30 № 3298778 60

>>3298425

дед>папка>ребенок
Такая последовательность дается на вход, нужно понять, точно ли папка от деда, ребенок от папки

Не совсем понял как where это проверит
Мне же нужно каждого parentа проверить динамически

Аноним 15/10/24 Втр 19:05:58 № 3299063 61

>>3298778
Я вижу два стула.
1. Рекурсивно построить полные пути от ребенка до самого далекого родителя, потом поискать среди полных путей исходный.
2. Разбить исходный путь на пары (родитель,потомок) и сделать джоин с таблицей связей в бд.
По идее, второй будет работать быстрее.

Аноним 15/10/24 Втр 22:25:16 № 3299273 62

>>3298778
Дк сджойни цепочкой деда на папу, папа на ребёнка, если EXISTS(), то всё ок

Аноним 15/10/24 Втр 22:32:27 № 3299277 63

>>3295957
Помню из-за какого-то сверхразума поймали коллизию счётчика айди мммм найс

Аноним 15/10/24 Втр 23:55:53 № 3299301 64

>>3298778
Ну ты тугой канеш.
Представь что твоя последовательность будет состоять всего из одной ноды. Вот надо тебе найти есть ли в таблице "дед". Как ты будешь эту ноду искать? Дерево будешь рекурсивно строить? Ясен хуй нет.

Ну так твой поиск нескольких нод прекрасно сводится к поиску каждой из этих нод по отдельности. Нам нужно найти что в таблице есть "дед", и в таблице есть "папка", и в таблице есть "внучек". Зачем для этого какие-то рекурсии и деревья?

Аноним 16/10/24 Срд 23:53:42 № 3300190 65

Базы данных в 95% случаев не нужны.

Аноним 17/10/24 Чтв 00:13:45 № 3300200 66

>>3300190
Запили двач без базы данных.

Аноним 17/10/24 Чтв 14:11:08 № 3300601 67

>>3300200
Можно жсонами всё хранить на норм ссд, изи. Юзать МуСКУФ в 2к24 - это кринге, чел.

Аноним 17/10/24 Чтв 14:59:46 № 3300625 68

>>3300601
> Можно жсонами всё хранить на норм ссд, изи.
Это тоже база данных. В определении понятия "база данных" нет ни слова о том, что это должна быть клиент-серверная многопользовательская поебота с таблицами, форенкеями, индексами, транзакциями и журналами.
> Юзать МуСКУФ в 2к24 - это кринге, чел.
Согласен.

Аноним 18/10/24 Птн 19:13:56 № 3301783 69

>>3300200
Вот сосач как раз легче лёгкого.

>>3300625
Ну, если так определить БД, то тогда да, очевидно никак без БД. Я имел в виду, что в 95% случаев хватит базы данных работающей как бекап оперативной памяти, т.е. очень очень простой.

Аноним 21/10/24 Пнд 14:35:44 № 3304397 70

>>3299301

Так размер этого дерева может быть разным, динамически формировать запрос предлагаете?
Или покажите пожалуйста пример, если не сложно
У себя я реализовал через возврат путей и поиск нужного

Аноним 22/10/24 Втр 02:22:47 № 3305027 71

>>3304397
>динамически формировать запрос предлагаете?
А можно как-то по другому запрос формировать? Дерево твое как в этот запрос попадает? Статитески что-ли?

Последний раз объясняю.
У тебя есть последовательность:
1 <- 22 <- 45 <- 75.
Эту последовательность можно представить в виде пар (id, parent_id):
(1, 0), (22, 1), (45, 22), (75, 45).
Нужно просто проверить что в таблице есть все эти записи. Есть записи - есть последовательность, если какой-то не хватает, то и последовательности нет.

Аноним 25/10/24 Птн 22:20:26 № 3308134 72

>>3301783
>95% случаев хватит базы данных работающей как бекап оперативной памяти, т.е. очень очень простой
Согласен, у нас редис на 200 ГБ и пара петабайт S3. Мы тексты обрабатываем

Аноним 27/10/24 Вск 22:16:15 № 3309162 73

Ну и как вкатиться в эти ваши Big Data? Заебался админить, хочу развиваться в чем-то более перспективном.

Аноним 27/10/24 Вск 23:12:56 № 3309170 74

>>3309162
Google.com ---> "big data courses" & "big data books"

Аноним 28/10/24 Пнд 10:40:55 № 3309319 75

>>3309170

Я рассчитывал получить рекомендации по конкретным книгам и курсам... Так я умею.

Аноним 09/11/24 Суб 00:45:35 № 3319215 76

>>3309162
Big data уже давно стало скверным баззвордом... Указывай конкретные технологии.
К слову, в данных ты также можешь админить, только это называется DevOps. Будешь хорошо устроен если разберёшься с K8S и изучишь какой-нибудь Go.
Ну или разрабом - учи SQL, Java/Python/Scala, Spark, Kafka, Flink, Airflow, ...
В принципе это всё - старый-добрый SQL, только одетый в модные шмотки.

Аноним 11/11/24 Пнд 16:29:33 № 3320533 77

Книжку по монгодб посоветуйте

Аноним 12/11/24 Втр 14:40:50 № 3321130 78

>>3268780 (OP)
Объясните мне пожалуйста почему у mysql такая конченая реализация репликации по дефолту?
Как будто я блять в какие-то 90-е вернулся.
Реплика мастер-мастер, было пару случаев когда ебанули внезапно електрику и когда внезапно ебанул у сервера второе питание.
Суть следующая - у этой хуиты слетает каретка sql потока, причем по логам бывает уебывает куда-то за пределы файла. В реальности оно наебнулось на какой-то одной операции, но ты хуй найдешь на какой потому что файл полубинарный.
Почему не сделать функцию рекавери слейва с мастера и его локом?
Почему не сделать операции построчно в файле и писать вместо позиции каретки в файле как ебланы - номер строки случилась хуйня чтобы эту хуиту можно было дебажить, т.е. сделать операцию и скипнуть ошибку?
Я уже молчу что можно было сделать в теории полное автовосстановление по парным/непарным индексам.
В мире есть какие-то способы/аддоны как совладать с этой хуйней?

Аноним 12/11/24 Втр 17:53:45 № 3321319 79

PostgreSQL
Есть таблица datetime-цена.
Хочу в результате запроса получить в одной строке цену за определённое время пятницы и за определённое время следующего понедельника.
Делаю
with (Номер недели, цена за требуемое время пятницы),
(Номер недели минус один, цена за требуемое время понедельника)
select join on номер_недели=номер_недели

Это нормальный способ, или уебанский и есть что-то проще?

Аноним 12/11/24 Втр 18:30:32 № 3321342 80

>>3321319
Пиздец ты долбоеб, кто тебя нахуй к компьютеру пустил?

Аноним 12/11/24 Втр 19:03:29 № 3321364 81

>>3321342
Ну а как надо-то?

Аноним 12/11/24 Втр 23:02:33 № 3321459 82

Вкатился на джуна аналитиком dwh
Возник вопрос. Есть ли какая-то позиция в сфере работы с БД где необходимо просчитывать что-то математически? Используя дискретную математику, реляционную алгебру и прочие разделы математики.
Подскажите плиз, если слышали о таком или знаете как двигаться в этом направлении.

Аноним 13/11/24 Срд 00:54:27 № 3321488 83

>>3321459
>Вкатился на джуна аналитиком dwh
Как именно, расскажи поподробнее.

Аноним 13/11/24 Срд 07:58:17 № 3321518 84

>>3321319
Надо план смотреть.
Сходу кажется, что ты 2 раза будешь читать таблицу, сначала выбирая пятницу, а потом - понедельник. И потом делаешь join.
Возможно, можно сначала сделать фильтр на пятницу и понедельник, чтобы база в один проход выбрала эти данные, а потом с ними работать.
Тут можно сделать join, а можно и оконку попробовать прикрутить.

Аноним 13/11/24 Срд 08:00:53 № 3321519 85

>>3321459
>работы с БД где необходимо просчитывать что-то математически
Data science? Там, правда, работы с самой СУБД практически нет, часто данные могут быть в виде файлов, например. Ну и анализ ты будешь делать при помощи библиотек на Python в Jupyter notebook.
Возможно, продвинутые аналитики тоже считают что-то математически, не знаю.

Аноним 13/11/24 Срд 08:24:59 № 3321521 86

>>3321488
Знакомый работает синьором в банке тоже аналитиком. Говорит нужны джуны, работа пизда скучная, но перспективная
Написал список тем типа sql, dwh, greenplum, python, что нужно знать
За месяц прочитал в инете про все это
Взяли туда джуном после скрининга и тех. собеса

Аноним 13/11/24 Срд 08:28:31 № 3321524 87

>>3321519
Не, я имею ввиду всё-таки использование в БД
Я хотел в ds попасть, но я великовозрастный вкатун, которого даже не рассматривают
Имел в виду про математическое моделирование БД, оптимизации этих моделей (про подобное краем уха слышал)

Аноним 13/11/24 Срд 09:02:15 № 3321535 88

>>3321524
Не знаю, о чём ты. Речь про построение модели данных? Звезда, 3NF, Data vault.
Этим занимаются архитекторы, по крайней мере выделением общих принципов. Аналитик обычно может разве что разложить бизнес сущности по этим принципам - например, абонент это сущность, а регион это SCD и так далее.
Ну и в целом там какой-то сложной математики нет.

Аноним 13/11/24 Срд 11:26:59 № 3321580 89

>>3321535
Понял, благодарю

Аноним 13/11/24 Срд 12:37:39 № 3321632 90

>>3321459
>где необходимо просчитывать что-то математически?
...в пайплайнах? Ну очевидно же! У тебя есть некоторый набор данных - логи, xml, pdf, что угодно. Они же блять не сами по себе загрузятся в базу данных? Вначале их надо обработать и что тебе мешает во время обработки добавить своих магических супер-пупер алгоритмов? А потом они уже уйдут в бд, delta lake, отчёты или куда-то ещё дальше.

Аноним 14/11/24 Чтв 11:55:40 № 3322213 91

Какие подводные хранить изображения в бинарном поле в mssql?
Или их по правильному нужно хранить в нереляционных базах вроде MongoDb

Аноним 14/11/24 Чтв 12:25:13 № 3322222 92

>>3322213
>хранить изображения в бинарном поле в mssql?
А нахера хранить их в базе данных? Какой в этом смысл? Ты конечно можешь хоть всё собрание сочинений Дюма залить туда. Но я исхожу из практических соображений. База данных она же блять ресурсы потребляет. И не абы какие. Все эти индексы, хранение, и прочее это всё стоит денег. Ты же не будешь под бд брать хостинг с hdd? Хороший топовый диск стоит невъебенных денег, около 3 тысяч баксов в месяц за 80K IOPS диск 512 гигабайт. Ну и плюс, это всё надо масштабировать, реплицировать, и так далее. А как быть если из-за твоих картинок запросы медленнее работают? Ну короче, что там такого супер важного, что эти картинки нельзя поместить в какое-нибудь объектное хранилище или обычный hdd-диск?

Аноним 14/11/24 Чтв 12:41:23 № 3322233 93

>>3322213
Вроде предпочтительно хранить ссылку на изображение, а сами изображения на диске.
Хотя, думаю, если объёмы небольшие, то всё равно где.

Аноним 14/11/24 Чтв 12:56:03 № 3322242 94

>>3322213
Никаких подводных. Выносишь картинки в отдельную таблицу Pictures(id,data), делаешь для нее партиционирование на отдельный диск, получаешь консистентность из коробки. С файловой системой ты рано или поздно проебешь бекапы и получишь ситуацию с ссылками на файлы, которых нет.

Аноним 14/11/24 Чтв 12:58:34 № 3322244 95

>>3322222
>А как быть если из-за твоих картинок запросы медленнее работают?
Перестать быть дебилом с орм головного мозга. Почитать, как работает бд и почему select * from table - это плохая идея.

Аноним 14/11/24 Чтв 13:26:11 № 3322268 96

На каких платформах можно потренироваться в написании запросов? Кроме sql-ex

Аноним 14/11/24 Чтв 13:28:09 № 3322271 97

>>3322244
Я не он, но не понял.
Если для картинок отдельная таблица, то оно не должно напрямую влиять на запросы бизнес-логики и прочего.
Если там оно всё в одной таблице, то будет влиять, если только БД не колоночная, которая умеет читать только нужные поля.

Аноним 14/11/24 Чтв 13:34:04 № 3322275 98

>>3322244
Это ответ на другой вопрос. А я спрашиваю ЗАЧЕМ В ПРИНЦИПЕ хранить картинки в бд. Не технический вопрос "сработает ли", а зачем? Хуй с ним, ладно. Пускай ты прав, всё масштабируется, работает, запрашивается. Ииииииии? Что мне мешает не ебать мозги, а хранить только ссылки. За тот вес, который занимает одна картинка я могу... даже не знаю... записать 500 текстовых записей?

Аноним 14/11/24 Чтв 13:35:51 № 3322278 99

>>3322275
Ну, будет ACID, не сможешь записать ссылку без картинки или картинку без ссылки.
И прочая консистентность, которую даёт СУБД.

Аноним 14/11/24 Чтв 13:51:03 № 3322288 100

>>3322278
Окей. И ради какого-то маааааааленького плюсика, ради отсутствия потенциально битых ссылок можно пожертвовать всем остальным: большую бд сложнее обслуживать, головняк при переезде на другую бд, плюс как ты собираешься раздавать эти файлы из базы данных? Открывать поток на стрим что ли? Если бы это была такая охуенная идея, пол-интернета давно бы хранило в бд. Но почему-то вместо этого выбирают cdn.

Аноним 14/11/24 Чтв 14:04:43 № 3322299 101

>>3322288
А, я мимо проходил, ОП идеи не я.
На тему best practice - аргумент так себе, люди в индустрии просто копируют чужие подходы в основном и всё.
Тема провокационная. С одной стороны - зачем использовать СУБД? С другой стороны - почему бы не использовать.
Реальный ответ тут только в стоимости ресурсов. Железо под шуструю OLTP будет дороже, чем под хранилку картинок, которая может быть медленнее.
Но, опять же, думаю, есть варианты настроить хранение изображений на отдельном железе, нужен только толковый админ.

Аноним 14/11/24 Чтв 14:12:19 № 3322307 102

>>3322288
Ты задачу уточни. Тебе нужен цдн с раздачей охулионы терабайтов в секунду? Или нужна консистентность, чтобы важный пдфник с договором не проебали? АСИД - это не маленький плюсих, это охуительный плюсище.

Аноним 14/11/24 Чтв 14:16:20 № 3322316 103

>>3322299
Погугли, что такое партиционирование в субд.

Аноним 14/11/24 Чтв 14:21:35 № 3322318 104

>>3322316
При чём тут оно?
Минутная гуглёжка выдаёт tablespaces для Постегрса.
Ну и нюансы, как всегда, возникают в процессе.

Аноним 14/11/24 Чтв 14:29:45 № 3322322 105

>>3322318
Суть в том, что можно разные таблицы хранить на разных дисках, блобы - на медленном хдд, индексы - на быстром дорогом ссд. Все происходит внутри субд, для тебя это обычный инсерт/апдейт, только с блекджеком и транзакциями. Для хранения пдфников в базе отличная штука.

Аноним 14/11/24 Чтв 16:43:14 № 3322385 106

>>3322299
>зачем использовать СУБД?
Действительно. Зачем использовать СУБД, если есть дата лейки для этого. Ну хочешь ты хранить картинки, пдфки - нахуй тебе СУБД? Возьми delta lake, там будет такой же acid. Прогоняешь по пайплайну и делаешь чё хочешь - хочешь нейронки обучаешь, хочешь анализ делаешь. СУБД изначально рассчитана на структурированные данные, там не предполагается, что ты начнёшь пихать емейлы или ещё какое неструктурированное говно в базу.

>>3322307
>важный пдфник с договором не проебали?
Смотри выше. Hudi/Iceberg/Delta Lake у них у всех есть acid. К тому же, для договоров имеет смысл использовать блокчейн на базе hyperledger fabric вместо стандартной бд. Я могу привести с десяток примеров таких стартапов: DriveChain, Euroclear, страховая компания Allianz, банк Норвегии и так далее.

Аноним 14/11/24 Чтв 17:14:58 № 3322413 107

>>3322385
Да, сейчас бы вместо одной СУБД развернуть lakehouse на кластере кубера с каким-нибудь S3 или Хадупом, сверху Айсберг, обмазать блокчейном и нейронками.
Мы поняли, что ты следишь за баззвордами.

Аноним 14/11/24 Чтв 17:30:38 № 3322431 108

>>3322413
>Мы поняли, что ты следишь за баззвордами.
Окей, иди нахуй тогда. Тебе предложили самый простой вариант - постить ссылку, ты недоволен.

ХОЧУ ХРАНИТЬ ФАЙЛЫ В СУБД
@
НУ ПОСТЬ ССЫЛКУ
@
А ВДРУГ ССЫЛКА БИТАЯ, МНЕ ACID НУЖЕН
@
НУ ДАТА ЛЕЙК ТОГДА
@
НЕТ ФАЙЛЫ ВАЖНЫЕ
@
НУ БЛОКЧЕЙН ТОГДА
@
МНЕ НЕ НРАВЯТСЯ ТВОИ БАЗЗВОРДЫ, МНОГО МОДНЫХ СЛОВ ГОВОРИШЬ

Аноним 14/11/24 Чтв 17:34:38 № 3322435 109

>>3322431
>иди нахуй тогда
Нет ты, /bратан.

Аноним 14/11/24 Чтв 17:46:04 № 3322448 110

я обязательно вкачусь в аналитику данных

Аноним 14/11/24 Чтв 19:33:59 № 3322544 111

1 год работал в отчётности в коллекторском агентстве - MS SQL.
1.5 года работал в DWH в банке риски - Oracle DB/MySQL.
1 год работал в разработчиком в кредитном конвейере в банке - Oracle DB.
2 года работал разработчиком в международном DWH - Oracle DB.
2.5 года уже работаю старшим инженером в банке - Greenplum/Postgresql.

Выгорел просто пиздец, ничего не хочется. Последнее время с петухоном работаю, это радует. Но хочется уйти в какой нибудь Golang. Что посоветуете?

Аноним 14/11/24 Чтв 19:36:16 № 3322545 112

>>3322544
>инженером
Дата-инженером (DE)

быстрофикс

Аноним 15/11/24 Птн 12:04:07 № 3322873 113

Нихуя вы тут срач развели из-за меня неофита.
У меня пара вопросов:
1) Как файл должен проебаться в файловой системе и не проебаться в бд. Если на диске наебнется сектор, то файл наебнеться внезависимости от того как он храниться? Или в бд (например mssql) есть какой-то механизм рекавери?
2) Что по производительности в двух случаях? Насколько я понимаю что файловая система будет быстрее.
У меня условная задача может на (всего-то) пару тысяч картинок которые желательно таки не проебывать как и в принципе любой файл.

Аноним 15/11/24 Птн 12:30:48 № 3322891 114

>>3322544
А чому выгорел? Заебывают? Я бы наоборот в дата-жирок хотел из копро-аналитики перекатиться, начал вот эирфлоу по вечерам дергать хаха

Аноним 15/11/24 Птн 12:34:50 № 3322895 115

>>3322891
Меня как раз заебывают аналитики. Мы пилим один из слоев данных и мне приходится из sql-говнокода аналитиков делать пайплайны. Очень рутинные и слабоавтоматизированные приседания.

Часть с airflow 2 как раз самая интересная в работе. И много где катируется, полезный опыт. Даги руками не пишем, кстате, автоматически сделали раскатку из dbt-проекта.

Аноним 15/11/24 Птн 13:03:30 № 3322927 116

>>3322873
Когда ты хранишь данные в нескольких местах, перед тобой встает проблема консистентности. Пока ты в одной бд, этим занимается сама бд, ты себе мозги не ебешь. Иначе тебе придется заморочиться с распределенными транзакциями, это много лишней работы из ничего. Ты сохраняешь файл на файловый сервер и ссылку в бд, файловый сервер возвращает ошибку таймаут, твои действия? Запись есть в бд, а на фс файла нет, как ты будешь синхронизировать информацию?

Аноним 15/11/24 Птн 13:12:31 № 3322934 117

>>3322927
в обработку ошибки добавим генерацию случайного изображения

Аноним 15/11/24 Птн 13:17:41 № 3322941 118

>>3322934
Загрузили важный договор.
Скачали фото котика.
Архитектура уровня яндекс маркет.

Аноним 15/11/24 Птн 13:19:55 № 3322943 119

>>3322941
мне пох че там грузили

Аноним 15/11/24 Птн 13:20:23 № 3322945 120

>>3322927
Над БД у тебя есть приложение, верно? Приложение пусть проверяет наличие файла. Если отсутствует отсыпает пользователю ошибку и удаляет саму строчку в БД. Либо повесь на переодический процесс. Чтобы синхронизировать файлы и строки в базе. Обычно это не является проблемой.

Аноним 15/11/24 Птн 13:32:40 № 3322971 121

>>3322945
Вооот. Уже появился демон, который надо написать и отладить. А потом к нему написать ямл и тоже отладить. А потом написать метрики, ты понел. На ровном месте система усложняется просто потому что.

Аноним 15/11/24 Птн 14:46:27 № 3323050 122

>>3322927
У меня прямо сейчас уже такая хуита - таблица с пикчами это уже по сути сорт оф справочник, то есть в другой таблице хранятся какие-то данные и перечисление айдишек картинок.
И при добавлении основной записи (с картинками) сначала добавляются картинки (и опционально чистятся старые), берутся новые айди и добавляются в основную таблицу. Если айди пикч не получены - исключение.
>>3322945
>>3322971
Практически все тоже самое будет при работе с фс, никаких демонов здесь не нужно, пускай приложение другим потоком дергает дохлые не рабочие сектора хдд до таймаута фс.

Аноним 15/11/24 Птн 16:13:40 № 3323121 123

>>3323050
У тебя уже есть рабочее решение. Ты хочешь его сломать. Зачем? Работает - не трогай.

Аноним 15/11/24 Птн 17:05:48 № 3323157 124

>>3278398
>есть Pandas для питонистов
Пандас и перфоманс это смешно, алсо это психическая нагрузка соединять несколько источников через эту библиотеку, когда как в duckdb можно одним sql-запросом поженить csv, паркет, таблицу из постгреса и выплюнуть ее и в пандас, и в поларс, и обратно в базу, и вообще куда угодно.

Аноним 15/11/24 Птн 17:49:18 № 3323187 125

>>3323121
Да мне перепилить нехуй делать.
Вообще мне интересна именно мат часть - насколько я сосу по производительности? Есть какие-то тесты минимальной реализации?

Аноним 16/11/24 Суб 18:12:54 № 3323728 126

>>3323157
>когда как в duckdb можно
А кому он нужен? В серьезных проектах его нет либо его не затащить, т.к. нет экспертизы эксплуатации и разрабов не найдешь. Даже тупо развернуть где-нибудь на вируталке уже проблема т.к. нет нужных знаний и опыта использования

Аноним 17/11/24 Вск 12:51:46 № 3324135 127

да что это такое ваша консистентность???

Аноним 17/11/24 Вск 17:59:08 № 3324316 128

>>3324135
Это когда в базе данных всё чотка. Одна таблица не противоречит другой. Все ID сопоставимы между таблами.

Аноним 17/11/24 Вск 22:19:01 № 3324464 129

>>3324316
благодарю

Аноним 18/11/24 Пнд 14:09:18 № 3324846 130

>>3324464
Как правило достигается через накручивание pk, fk, uq и check констреинтами.

Аноним 18/11/24 Пнд 17:19:45 № 3324973 131

>>3324846
Вообще типы данных должны быть хотя бы корректными, а не даты в строках и идентификаторы с дробной частью.

Аноним 18/11/24 Пнд 18:26:52 № 3325041 132

>>3324973
неужели так кто-то делает?

Аноним 18/11/24 Пнд 19:24:32 № 3325091 133

>>3324973
Иногда это целесообразно, но черезвычайно редко. Например, мы у себя в залупе хадупе храним cob_date как стрингу. Ибо это дата партицирования. Так нам удобнее хранить в YYYY-MM-DD. Все в банке знают что это партиция.

Аноним 19/11/24 Втр 00:10:20 № 3325262 134

>>3324135

Аноним 19/11/24 Втр 00:56:35 № 3325266 135

>>3325262
Ты чо такой дерзкий?

Аноним 19/11/24 Втр 12:00:55 № 3325412 136

Нужно ли знать порядок выполнений операторов в скл-запросах?

Аноним 19/11/24 Втр 19:05:32 № 3325744 137

>>3325412
И какой порядок? Это как оптимизатор решит

Аноним 19/11/24 Втр 19:54:18 № 3325771 138

>>3325412
Надо уметь читать план запроса.

Аноним 21/11/24 Чтв 02:20:21 № 3326446 139

image.png 40Кб, 1144x295

Почему нет свежих пиратских версий Aqua Data Studio? Нормальный же инструмент был. Пикрил - рутрекер, а на пиратбэй вообще 0 результатов. Подумал, что софтина загнулась, но нет, на офф сайте версия от 24го года есть.

Может я от жизни отстал и это уже нинужно? Какой сейчас инструмент используют для доступа к различным бд в одной программе, какой-нибудь DBeaver? Нужно PostreSQL, MSSQL, MySQL, Oracle, Sybase - работаю с разными вендорами да

Аноним 21/11/24 Чтв 02:23:13 № 3326447 140

>>3326446
Обычно DBeaver. Драйвера ставишь под нужную базу в настройках подключения и всё.

Аноним 21/11/24 Чтв 11:50:42 № 3326623 141

>>3326446
Dbeaver наше всё.

Аноним 22/11/24 Птн 16:44:39 № 3327438 142

>>3278398
Да их просто заебал хадуп.
Исследование данных для ДС должно быть быстрым. Нет заранее составленного плана. Нет алгоритма.

Алсо есть еще один очевидный трюк: если скачать 1/100 данных из прода взятую истинно случайным образом, то механика создания модели и ее результаты будет такие же. Просто ее нужно будет в конце доучить всеми имеющимся данными

Аноним 22/11/24 Птн 17:20:24 № 3327468 143

>>3278398
> Polars, Dask, Ray, DuckDB, и т.д.
Что за нонейм кал?
> Кто-нибудь может объяснить мне, какие задачи у этой ебалы?
Очень быстро. Очень. Быстро. Можно на одной машине обрабатывать 100к реквестов/сек или даже 500к. Нахуя мне любые другие sql или какие-то монги если они в 100 раз медленнее? Многие запросы на обычных бд бессмысленно выполнять, ибо производительность никакая, конечно это связано с лм нейронками и обработкой бихдаты.

Разделение на микросервисы тоже в тему - огромные БД с огромными возможностями уже не нужны так как раньше, логика разделена, огромным кол-вом говнокода ничего не засирается, быстрота, надёжность, примитивность, все в плюсе.

Жди ещё больше развития этой темы, в будущем нахуй ничего не нужно будет что-то кроме лмдб и аналогов.

мимо на лмдб

Аноним 23/11/24 Суб 17:54:23 № 3327869 144

>>3327468
В мире есть не только OLTP, есть ещё OLAP и прочие data/grabage/lake/house решения.

Аноним 23/11/24 Суб 19:04:20 № 3327928 145

>>3327869
Каво, блядь? Сам-то понял что высрал? Всё это работает на обычных "таблицах", на той же лмбд твоих олапов построено чуть больше чем дохуя. И в каждой из реализации, кста, работают транзакции.

Аноним 23/11/24 Суб 19:09:23 № 3327933 146

>>3327928
Охуеть, а внутри всё на C написано.
Выкини свою LMDB, gcc/clang - это всё, что тебе нужно.
Вот это ты эксперт.

Аноним 23/11/24 Суб 19:19:25 № 3327937 147

>>3327933
Зачем ты опять высрал какую-то бессвязную чушь? К чему это всё?

Аноним 23/11/24 Суб 19:26:05 № 3327941 148

>>3327937
>пук
Если ты ничего не понял, ещё не означает. что несвязное.
Я у тебя спрашиваю, эксперт, тебе надо построить классическое аналитическое DWH, в котором будет ingest, модель данных, datamart слой, куда будут ходить аналитики и прочие BI-щики чтобы писать свои аналитические запросы.
Жду от тебя описания решения на основе LMDB.

Аноним 23/11/24 Суб 20:17:37 № 3327967 149

>>3327941
Просто берёшь и строишь, ты, блядь, совсем даун что ли? Неужели тебе безумно сложно представить как работает векторная индексация в многомерных массивах?

Чел, если ты такой даун что не понимаешь как подобное работает - тебе не стоит вообще об этом рассуждать и что-то там кукарекать про бд. Это не твоё.

Аноним 23/11/24 Суб 22:19:57 № 3328047 150

>>3327967
>Просто берёшь и строишь
Что и требовалось доказать.
Я говорю, конкретно описывай решение, компоненты, на каких платформах работают, интеграции с другими системами, стоимость, сроки внедрения.
Ничего ты не расскажешь, видно, что ты в этом треде прямо сейчас узнаёшь, что работа с данными - это не только база в микросервисе. Ничего, просвещайся.

Аноним 24/11/24 Вск 11:36:04 № 3328220 151

>>3328047
Очнись, вкатун, ты маркетинга нажрался. Абсолютно все аналитические запросы отдаются команде которая работает с БД, она и пишет для этого апи. Никакие блщики и аналитики своими руками с БД никогда работают и не будут работать, не мечтай о доступе к бд.

Конечно я понимаю что ты вкатун и никогда с бд не работал, но можешь поверить мне, любые аналитические запросы не занимают больше 5 строк кода.

Аноним 24/11/24 Вск 13:19:09 № 3328283 152

>>3327941
>Если ты ничего не понял, ещё не означает. что несвязное.

Перечитай еще раз. И прекрати позориться.

Аноним 24/11/24 Вск 16:29:32 № 3328392 153

>>3328283
Позоришься тут только ты, вкатун, фантазируя про великие OLAP системы, которые кто-то годами очень сложно интегрируют, лолд.
В реальности почти вся аналитка это полтора запроса к любой бд. Притом эти запросы можно оптимизировать как угодно, в отличии от написанного кем-то говна.

Аноним 24/11/24 Вск 17:31:07 № 3328407 154

>>3328220
Вкатуна ты в зеркале увидишь.
Пока вижу от тебя только общие слова.
В следующем сообщение ты описываешь, хотя бы верхнеуровнево, схему DWH на LMDB, c DM слоем для аналитических запросов, или ты обосрался, хотя это и так было изначально очевидно.

Аноним 24/11/24 Вск 20:17:24 № 3328472 155

>>3328407
Вкатун, ещё раз тебе говорю, слушай внимательно. Если нужна аналитика - ты ПРОСТО берёшь и ПИШЕШЬ на бекенде все нужные запросы к бд. Всё. Просто берёшь и пишешь.

Для тебя это сложно потому что ты вкатун, понимаю тебя, но писать код аналитики в бекенде проще чем работать с какой-то обосранной бд с своим синтаксисом и своими проблемами, которая написана наверняка на другом языке. Всё это нахуй никому не всралось.

И да, вкатун, ты наверное не в курсе, но все dw и прочий шизокал работают поверх обычных субд и все из них могут работать с внешними хранилищами. Просто берёшь и подключаешь kv хранилище к любой OLAP системе. Но т.к. ты в катун, ты даже помыслить об этом не смог, да, ну не фантазируй больше, штош...

Аноним 24/11/24 Вск 20:50:04 № 3328493 156

>>3328472
>слушай внимательно
Так что слушать, ты опять хуйню написал, быкендер. У тебя ограниченный кругозор технологий и дальше своей поляны ты видеть неспособен.
>Если нужна аналитика - ты ПРОСТО берёшь и ПИШЕШЬ на бекенде все нужные запросы к бд. Всё. Просто берёшь и пишешь.
Вот это ты эксперт. То есть то, что информация раскидана по разным СУБД, а каноничная архитектура подразумевает по базе на сервис, тебя не смутило. И аналитический запрос у тебя по сети через ДБлинки будет тянуть данные за периоды вроде года. Вот так архитектура уровня /pr.
Это уж я молчу, что на проекте может быть много разных систем, не связанных между собой, с которых надо тянуть данные.
Опять же, если даже предположить, что "эксперт" вроде тебя разрешил делать аналитику прямо в сервисах, то запуск отчётности вместе с пиковой нагрузкой положит твою систему к хуям.
>Просто берёшь и подключ
Примеры в студию, давай.
Вот интеграции CH - там нет: https://clickhouse.com/docs/en/integrations
Упс.
Ну ладно, давай посмотрим просто FDW для PostgreSQL: https://wiki.postgresql.org/wiki/Foreign_data_wrappers
Ох, тоже нет, ну ладно. Хотя и GP тогда тоже пролетает.
Ну и так далее. Примеры интеграций в студию.

P.S.: поражает, как каждая web-monkey считает себя экспертом во всём, научившись писать CRUD-сервисы.

Аноним 25/11/24 Пнд 00:25:28 № 3328584 157

>>3328493
Зачем ты его кормишь? Это же эксперт уровня епам.

Аноним 25/11/24 Пнд 06:10:24 № 3328636 158

>>3328472
> Вкатун, ещё раз тебе говорю, слушай внимательно. Если нужна аналитика - ты ПРОСТО берёшь и ПИШЕШЬ на бекенде все нужные запросы к бд. Всё. Просто берёшь и пишешь.

Ты чо ебанутый? Или у тебя проекты уровня 3 факта, 2 справочника?

У меня только в банке кредитный конвейер это 7 разных баз данных. В каждой базе ориентировочно 10-50 табл. Аналитик просто умрет попробуя это все написать. А кроме КК ещё дохуя чего есть: риски, коллекшен, телефония, операционка, банкоматы, фрод, маркетинг, внутренние сервисы, капитал, гроб, кладбище, пидор.

Макака ебучая, кто вообще делает аналитику на беке?

Аноним 25/11/24 Пнд 12:35:15 № 3328894 159

>>3328493
> То есть то, что информация раскидана по разным СУБД, а каноничная архитектура подразумевает по базе на сервис, тебя не смутило.
И что, в чем проблема?
> Опять же, если даже предположить, что "эксперт" вроде тебя разрешил делать аналитику прямо в сервисах
Что ты несешь, шиз? Всё что требуется для аналитики - простое создание прокси для всех запросов, прокси который к любой БД подключается.
> запуск отчётности вместе с пиковой нагрузкой положит твою систему к хуям.
Вкатун манямечтает, лол. Даже если не делать отдельную БД никакой проблемы с этим нет, ведь та же LMDB выдерживает 1кк запросов в секунду. Другие бд похуже будут, но всего лишь нужно запросы раскидать по времени. И конечно так мало кто делает, только если отчётность в целом нахуй не нужна и не является приоритетом.
> Вот интеграции CH - там нет: https://clickhouse.com/docs/en/integrations
АХАХАХ, вкатун, ты ебанулся совсем? Это что по-твоему? https://clickhouse.com/docs/en/integrations/data-ingestion/dbms/odbc-with-clickhouse
Может ты англюсик не знаешь, вкатун? Держи на русском https://clickhouse.com/docs/ru/engines/table-engines/integrations/odbc
> Ну ладно, давай посмотрим просто FDW для PostgreSQL: https://wiki.postgresql.org/wiki/Foreign_data_wrappers
И снова обосрался, ODBC первым пунктом.
> P.S.: поражает, как каждая web-monkey считает себя экспертом во всём, научившись писать CRUD-сервисы.
Меня поражает твоя непроходимая тупость, вкатун. Ты буквально кинул ссылку и не смог прочитать её. Ты же буквально даун, чел, нахуй ты вкатываешсья вообще? Чтобы над тобой на собеседовании орали всем отделом?

Аноним 25/11/24 Пнд 12:48:04 № 3328903 160

>>3328636
> Аналитик просто умрет попробуя это все написать
Аналитикам вообще не выдают никакие доступы к БД, они с продом вообще никак не связаны. Им либо выдают готовые данные, которые они запросили и которые им дали с прода, либо отдельные БД, в которые весь кал с бека отправляется.
> Макака ебучая, кто вообще делает аналитику на беке?
Ты думаешь что апи для бд не на беке пишется или что? Аналитика по-твоему как-то сама появляется магическим образом или как?

Аноним 25/11/24 Пнд 16:27:19 № 3329081 161

>>3328903
Ты троллишь? Как быть в ситуации когда у тебя дохуялион баз данных? И все эти данные надо как то между собой связывать, агрегировать, строить разные слои.

Все это делается в DWH.

Аноним 25/11/24 Пнд 17:08:53 № 3329106 162

>>3329081
Просто берёшь и все запросы транслируешь в другую бд, в которую всё это складируется, без транзакций, офк. Это на бекенде обычно делают, ты правильно угадал. Иногда всю бд копируют или составляют всякие хитрые обновления. Вместо какой-то шизоидной DWH и прочей маркетинговой чуши достаточно обычного хранилища kv, подключаются к нему на питоне пишут все аналитические запросы. Пистон и kv бд из-за этой хуйни и взлетели, ибо это гораздо эффективнее чем любые другие подходы.

Эти вкатунские маняфантазии про DW в реальности нахуй никому не нужны, по обыкновению это инициатива всяких шизов и швали из менеджеров которые решили на откатах сыграть.

Аноним 25/11/24 Пнд 17:51:37 № 3329145 163

>>3328894
ODBC - это снадарт драйвера. Такой же, как и JDBC. Тебе нужна ещё реализация под конкретную базу.
Вот список драйверов ODBC из Python wiki, там нет LMDB: https://wiki.python.org/moin/ODBCDrivers.
LMDB через bindings работает, если что.
Ты как-то проигнорировал вопрос про перформанс тяжёлых query с распределёнными по сети источниками. Очевидно, ты не знаешь , что ответить. У тебя твои сервисы будут ещё и как кластер Хадупа, видимо, раьотать.
Про solid, ты, конечно, ничего слышал тоже, хотя вроде ожидаемо от webdev. Ну, тут чувствуется тон веб-мастера "интернет-магазины под ключ".
>>3328903
>апи для бд
Никто не интегрирует потоки данных через web api. Для этого у самой базы есть средства для интеграции, и есть ETL инструменты.
Но вообще потоки данных с сервисов сливают через Kafka, как самую популярную шину данных.
Ну и в целом,тебе уже всем тредом объясняют, но ты, конечно, давай, ты же прав - а значит можешь сэкономить компаниям буквально миллиарды. Облачные провайдеры просто деньги печатают, а ты знаешь, как проще. Почему ты ещё не новый Матей Захария какой-нибудь - не знаю.
>>3328584
Так это прокачивает технический speech. А тупые вопросы всегда самые сложные.
Вполне возможно, что твои коллеги находятся на таком же уровне, или вообще не задумываются, а почему бы всё не делать на беке? Зачем нужна СУБД? Просто на работе обычно все больше стесняются.

Аноним 25/11/24 Пнд 18:20:42 № 3329160 164

>>3329145
>Тебе нужна ещё реализация под конкретную базу.
Просто берёшь и пишешь, ничего в этом сложного нет, обычный c. Опять же, если для тебя столь примитивные функции сложны и необычны - тебе вряд ли стоит этим заниматься.
>Ты как-то проигнорировал вопрос про перформанс тяжёлых query с распределёнными по сети источниками. Очевидно, ты не знаешь , что ответить.
Конечно я не знаю как ответить, я даже не знаю что ты хотел высрать. Все тяжелые запросы собраны на одном сервере, распределение микросервисов как раз идёт по тому какие запросы и как часто обрабатываются.
> У тебя твои сервисы будут ещё и как кластер Хадупа, видимо, раьотать.
Если это потребуется вообще, к 128тб ещё пиздюхать очень долго на микросервисах. У меня не гугл и не амазон, данных всего на 140тб накопилось за три года.
> Про solid, ты, конечно, ничего слышал тоже, хотя вроде ожидаемо от webdev. Ну, тут чувствуется тон веб-мастера "интернет-магазины под ключ".
Шиза какая-то пошла уже, солид, блядь, лол
> Никто не интегрирует потоки данных через web api.
Конечно нет, ведь это делают через нахуя тебе палить через что их делают, кек, страдай
> Но вообще потоки данных с сервисов сливают через Kafka,
Как там в 2015 году, вкатун? Старые статьи читаешь, читай что-нибудь поновее.

Аноним 25/11/24 Пнд 18:31:53 № 3329174 165

>>3329160
>Просто берёшь и пишешь,
Ну то есть ты наврал про "известные и простые интеграции в любую OLAP". Разобрались.
>и пишешь, ничего в этом сложного нет, обычный c
Я же спрашиваю, сроки внедрения, бюджет, архитектура. Ты скромно промолчал.
То есть опять пустота.
>я даже не знаю
Это потому что уровень твоей экспертизы сильно ниже понимания проблематики.
Сервисы разделены, а аналитика нужна в одном месте.
>Если это потребуется вообще
Ну то, что в твоей webdev конторе с таким не сталкивались, не означает в масштабах индустрии вообще ничего.
>Шиза какая-то пошла уже
Ну, сочетание двух зон ответственности в одном сервисе? Раздельное машстабирование нагрузки, технологий, команды, которые над этим работают? Ошибки аналитики, которую моджно подождать, кладущие critical сервисы?
Иентересно, кто нанимает СТО, который одобрит такое.
> палить
> в 2015
Учитывая историю сообщений, тебе едва ли кого тут удалось заинтриговать, так что можешь оставить своё секретное знание себе.
Я же говорю, рынок ждёт твоих откровений, тебе топы сделают отсос с проглотом за такое. Вперёд.

Аноним 25/11/24 Пнд 18:42:48 № 3329182 166

>>3329174
>Ну то есть ты наврал про "известные и простые интеграции в любую OLAP". Разобрались.
Не понял, интеграция через ODBC есть, подключение есть, для тебя написать полторы функции на с это как-то сложно? Блядь, даже GPT с этим справится, просто по документации берёшь и пишешь.

Если сложно то ты видимо никогда в целом программированием не занимался и вероятнее всего местный клоун, так что бессмысленно с тобой говорить...

Аноним 25/11/24 Пнд 18:50:48 № 3329191 167

>>3329182
Ну как то ты слился быстро.
Челик, проекты в нормальных компаниях - это не просто написать две функции в своём пет-проекте. Если ты будешь там персональные данные передавать, а они у тебя скорее всего так или наче есть, то все архитектурные комитеты, безопасники должны всё согласовать.
Тем более на C, где гарантия консистентности данных, отсутствия ошибок памяти? Сколько по времени будет отладка проходить и сколько компания потеряет денег за это время? Кто будет латать дыры security? Слишком много рисков на навыки разработки человека, который не знает, что такое SOLID. Уже даже правительство США рекомендует не писать на C/C++. Ну, у тебя-то проблем точно не будет.
Ну ладно, ты протолкнул свой драйвер, СТО отошёл покурить и все согласились.
По остальным пунктам что? Нихуя.
Ну зато ты на С умеешь писать 2 функции, где ты только такому научился?
Может уже закончишь? По твоей штанине на весь раздел уже течёт.

Аноним 25/11/24 Пнд 19:48:50 № 3329245 168

17314844513040.webm 204Кб, 460x668, 00:00:04

>>3329106
Спасибо, похихикал

Аноним 25/11/24 Пнд 20:15:29 № 3329257 169

>>3329191
>Тем более на C, где гарантия консистентности данных, отсутствия ошибок памяти?
Никто не пишет на с, все пишут на выбранном подмножестве с/с++.
>Сколько по времени будет отладка проходить и сколько компания потеряет денег за это время?
Мой драйвер занимает 178 строк кода, например.
> SOLID
Для петухов.
> Уже даже правительство США рекомендует не писать на C/C++
Обязательно слушайся.
> Может уже закончишь? По твоей штанине на весь раздел уже течёт.
Чел, я тебе ещё раз говорю, всё это не нужно и бессмысленно. Сколько бы ты не отрицал реальность, но втои мантры про DW и SOLID (к чему это вообще?) бессмысленны. Никто так не пишет в 2к25 году, кроме промытых корпоблядей с легаси которое никто годами не переписывал.

Аноним 25/11/24 Пнд 20:46:31 № 3329266 170

>>3329257
> не нужно
> проигнорировал все неудобные вопросы
Я тебя про строки кода спрашивал что ли? Нет.
Авторитет твоего мнения на тему того, кто и как пишет уже понятен.
Вопрос - долго будешь позориться тут?

Аноним 25/11/24 Пнд 21:38:42 № 3329303 171

>>3329266
ООП-петушок рассказывает про авторитетное мнение, лол.

Слушай, может ты про какой другой СОЛИД высрался? Просто я не понимаю как можно быть таким безумным вкатуном-шизом который про солид кукарекает в треде про бд, лол

Аноним 25/11/24 Пнд 21:42:41 № 3329305 172

>>3329303
Ведь SOLID применяется только в ООП...

Аноним 25/11/24 Пнд 21:51:29 № 3329314 173

>>3329305
Он у тебя везде применяется, ведь ты ООП-петух, это я знаю. Без этой шизы ты жить не можешь уже.

Аноним 25/11/24 Пнд 22:02:33 № 3329316 174

>>3329314
Судя по тому, что ты сменил тему и просто кидаешься какашками, можно заключить, что ты признал свою неправоту на тему OLAP на LMDB в сервисах и добавить тебе нечего.
Это хорошо.
Дальнейшее общение не слишком интересно ввиду твоей зашоренности и высокой степени догматизма, явно слепо унаследованного из определённой кодерской субкультуры. С таким же успехом можно поговорить с нейросетью. Поэтому не мешаю.
Замечу лишь, что любому профессионалу очевидно, что и ООП, и ФП, и процедурное, реактивное, аспектно-ориентированное программирование, и OLAP, и OLTP, и библиотечки на C, микросервисы и монолиты - всё просто инструменты, которые имеют свои плюсы и минусы и свою область и специфику применения.
Удачи.

Аноним 25/11/24 Пнд 22:20:10 № 3329330 175

>>3329316
Погоди, ты тут несколько постов доказываешь мне как невозможно построить OLAP на LMDB потому что невозможно написать аналитические функции на питоне потому что потому, и я тут догматик? Здоровенные проекции конечно, ничего не скажешь.

Алсо, ещё вспомнил твой обсер с питоном и лмдб, в котором ты увидел новое для себя слово - биндинги, кек, и сразу же обосрался в треде, что-то несвязно кукарекая про драйвер. Забавно, уже даже не обращал внимания на эти высеры вкатуна с DW-шизой в голове

И напомни, ооп-петушок, к чему ты приплёл SOLID? Ты ощутил потребность сказать что-то умное, но забыл снять штаны?

Аноним 26/11/24 Втр 00:40:28 № 3329385 176

Работаю джуном системным аналитиком в банке
Из стека - это greenplum, airflow и питон
Сам делаю всякие маппинги и документалку к ним пишу
Пока ничего особо интересного
Планирую разобраться в разработке, как вообще происходит все etl процессы, архитектура строится, потоки и тд
Подскажите как вообще расти как специалист? Планирую лет через 6 стать примерно архитектором данных
Может есть ещё какие-то более интересные или активные смежные направления типа MLOps или облачные хранилища
Поделитесь плиз у кого опыт есть в этих вопросах или знает чего по этому поводу

Аноним 26/11/24 Втр 02:11:27 № 3329401 177

>>3329385
>облачные хранилища
Нуууу из облачных остались aws glue + athena + redshift. Но в России aws нахуй никому не интересен. Из ажур - synapse, тоже нахуй не упёрся. Databricks - санкции. Snowflake - санкции. Про informatica, talend, alation, collibra тут почти никто не слышал. Остаётся яндекс и опенсоурсное, всякие там апачи и прочее.

>активные смежные направления типа MLOps
Это из другой оперы.

>Подскажите как вообще расти как специалист?
Книжки читать. O'reilly.

Аноним 26/11/24 Втр 10:26:57 № 3329527 178

>>3329401
>Это из другой оперы.
Сильно отличается? Чем?

Аноним 26/11/24 Втр 13:38:25 № 3329649 179

>>3329257
>SOLID
с этим то что не так?
мимпроходил

Аноним 26/11/24 Втр 13:52:57 № 3329672 180

Просто ебейшая

Аноним 26/11/24 Втр 16:06:01 № 3329800 181

>>3329672
АГДЕ ? Только не говори что ты на бумаге покупаешь

Аноним 26/11/24 Втр 16:09:26 № 3329805 182

>>3329800
А, это еще весной украли.
То есть, она есть везде.

Ну ok.

Аноним 26/11/24 Втр 16:54:30 № 3329840 183

>>3329800
рутрекер, на флибусте нет, внезапно

Аноним 27/11/24 Срд 16:47:59 № 3330621 184

>>3329649
Нет четкого определения что такое SOLID, каждый аффтор несёт свою собственную вариацию. То же шизло выше предлагает применять его не только к коду, но и к БД и его совершенно не смущает что это звучит как бред дошкольника. И это обычное явление в среде поклонников всяких солидов и ооп.
Осторожней с этой хуйней, как и с любой другой сверхидеей.

Аноним 27/11/24 Срд 17:44:59 № 3330650 185

>>3330621
при применение солид к БД согласен, эзотерика какая-то
а разве солид - это плохо? вроде позволяет поддерживать/расширять код, явно лучше, чем строчить всё в одном файле?
>ооп
а со сверхидеей ооп что не так? голанг-разработчик в треде, все ссым на джавистов!?
ведь только в джаве ооп это реальная ебля и огромное кол-во спагетти кода

Аноним 27/11/24 Срд 18:28:54 № 3330678 186

>>3330650
> эзотерика какая-то
Эзотерика приятнее будет. Это просто шиза.
> а разве солид - это плохо? вроде позволяет поддерживать/расширять код, явно лучше, чем строчить всё в одном файле?
Смотря от задач, очевидно. Иногда абстракции хорошо, но чаще это хуета и шиза, интерфейсы ради интерфейсов, типы ради типов.
> а со сверхидеей ооп что не так?
Абстракции протекают и мешают, очевидно. Вместо того чтобы писать код, пишут тесты на кучу интерфейсов и абсракций. Компонентный подход (для ооп композиция вместо наследования) куда адекватнее в этом плане, но реализация не так проста.
> ведь только в джаве ооп это реальная ебля и огромное кол-во спагетти кода
Можно на любом языке написать невообразимое макаронное поделие приправленное дерьмищем и аскридами, ооп позволяет это делать. И примеров этому не счесть.

Аноним 29/11/24 Птн 13:07:30 № 3331831 187

Тяжко идут подзапросы, пиздец, приходится сначала миллион селектов писать отдельно, а потом уж их объединять

Аноним 03/12/24 Втр 22:44:23 № 3334406 188

Господа, у меня общий вопрос по быстродействию.
Допустим, у меня 2 гигантских селекта, которые я объединяю с union. Для себя в конце каждого на момент запиливания я использую group by, чтобы понять то ли я вывожу, но есть ли смысл группировать в конце каждого селекта, если груп бай все равно выберет нужное?

Аноним 04/12/24 Срд 04:38:02 № 3334488 189

>>3334406
Сравни планы запросов, там все написано.

Аноним 04/12/24 Срд 06:50:41 № 3334505 190

>>3334406
Что значит "ГИГАНТСКИЙ СЕЛЕКТ"?
У тебя большое количество данных или большой результат?
UNION удаляет дубликаты и сканирует для этого каждую строку, а UNION ALL просто прилепляет строки вниз существующей выборки.

Аноним 06/12/24 Птн 11:47:12 № 3335966 191

Аноны, подскажите ньюфагу.
Делаю проект (что-то вроде корпаративного планировщика задач для организации из 70 человек). Вся база данных на SQLITE.
Есть три таблицы: авторизация (логины и пароли), события календаря и информация о работниках (должность, департамент и т.д.).
События календаря будет самой объемной таблицей, так как минимальная длина события - 30 минут.

Как будет правильней: выносить каждую таблицу в отдельный db-файл, или наоборот, сделать один db-файл, а в нем три таблицы?
И как будет правильней хранить события - для каждого работника в отдельном файле/таблице, или для всех работников в одной таблице/файле?

Аноним 06/12/24 Птн 12:55:30 № 3336068 192

>>3335966
> авторизация (логины и пароли)
В общем случае так делать неправильно, но предположим, что у тебя лаба или пет-проект, где возможно всё.
> Как будет правильней: выносить каждую таблицу в отдельный db-файл, или наоборот, сделать один db-файл, а в нем три таблицы?
Правильно в одном файле. Несколько файлов - это баз данных, с несколькими базами данных можешь забыть о транзакциях и ссылочной целостности.
> И как будет правильней хранить события - для каждого работника в отдельном файле/таблице, или для всех работников в одной таблице/файле?
В одной таблице. Прикинь создавать по таблице на работника, а потом ещё генерировать километровые селекты из-за union по 70 таблицам.

Аноним 06/12/24 Птн 15:02:51 № 3336194 193

>>3336068
Спасибо!
А что именно неправильно по таблице авторизации?
Пароли у меня в хэшированном виде, если что. Логин в виде строки.

Аноним 06/12/24 Птн 15:08:48 № 3336196 194

>>3336068
И еще вопрос: какие есть способы обезопасить базу sqlite от взлома? SQlite нет функции доступа к файлу bd по паролю (точнее, они есть, но замороченные)

Аноним 06/12/24 Птн 15:51:59 № 3336229 195

>>3336194
> Пароли у меня в хэшированном виде, если что.
Ну, хотя бы так.
>>3336196
В чистом SQLite мало что можно сделать, разве что обезопасить доступ к самому серверу. Файл БД шифровать мало толку, даже если сумеешь это сделать, всё равно основное приложение находится где-то недалеко, ключ просто возьмут из его конфига.

Аноним 07/12/24 Суб 08:53:18 № 3336589 196

>>3336196
В sqlite есть поддержка пароля, но я бы шифровал данные в самой бд, а ключи бы хранил в бинарниках приложения.

Аноним 10/12/24 Втр 11:05:37 № 3338550 197

Можно ли делать огромную таблицу со всеми действиями пользователей? То есть такой лог всего всего, на случай, если что то пойдет и не так и придется разбираться что случилось? Можно ли по этому логу гулять по ссылкам на события? Например, сначала пользователь заказал товар, это записалось. Потом через неделю до пользователя доставился товар и он открыл спор по этому товару. Я бы хотел, чтобы это событие хранило идшник события с заказом, чтобы можно было достать историю. Не будет ли проблем, если таких действий много, но при этом сильно далеко в прошлое обращения не уходят?

Аноним 10/12/24 Втр 11:26:00 № 3338570 198

>>3338550
Норм практика, только партицируй по дате. Только подбери диапазон месяц или день. И навесь индексы на те поля к которым будешь обращаться, но не переборщи, иначе будет запись долгая.

Аноним 10/12/24 Втр 11:31:04 № 3338574 199

>>3338550
P.S. наверно одного индекса будет достаточно. По id пользователя. Индекс глобальный по всем партициям. Чтобы быстро доставать все действия юзера.

Аноним 10/12/24 Втр 13:18:56 № 3338682 200

>>3338550
В бухучете так и делается, там каждое движение со счета на счет - это отдельная строка в таблице. Если ожидается прям дохулион записей, подумай о шардировании по userId.

Аноним 10/12/24 Втр 17:55:00 № 3338892 201

>>3338570
>>3338574
>>3338682
Посмотрел как это в моей дб делается. Делается PRIMARY KEY по паре из атрибута по которому нужно разбивать и ид. И уже не первому атрибуту указывается диапазон. Но там это делает в контесте хранения партишионов на разных устройствах, а не про логическое ускорение. С какого момента стоит париться? Или если в таблице меньше миллиона записей, то можно хуй забить и потом уже когда нибудь это сделать, когда таблица разрастется ?

Аноним 10/12/24 Втр 18:03:24 № 3338901 202

И да, спасибо

+ я увидел как можно в запросе указать партишн для поиска. То есть я могу написать запрос который будет искать сначала среди заказов которые были в ближайшую неделю, а потом уже, если не было найдено нужного, искать в остальной таблице. В предположении, что подавляющее большинство нужных строк лежит в этом диапазоне, я смогу не париться о размерах основной таблице, даже если она огромная. В крайнем случае, можно будет такие запросы пачками отправлять, ценой увеличенного времени ожидания пользователей

Аноним 10/12/24 Втр 18:41:58 № 3338922 203

Еще вопрос возник. А можно ли в одну таблицу уместить все события? Или мне в любом случае надо будет делать 1 большую таблицу где будут храниться только ссылки на события в другх таблицах которые уже описывают структуру конкретного типа событий

Аноним 10/12/24 Втр 19:27:50 № 3338960 204

>>3338550
Начнём с того, огромную таблицу - насколько "огромную"? Можно в количественном выражении сказать? Это гигабайт? Сто гитабайт? Терабайт данных? Далее, как именно эти данные будут использоваться? Будет ли у вас обнаружение мошенников в реальном времени? Бизнес-аналитика? Обучаете ли вы нейронки на этих данных? У вас работают в компании бизнес-аналитики? Дата сцаенс?

Если 100+ гигабайт данных + в компании есть аналитики и дата сцаенс ---> то дата лейк/лейкхаус + айсберг. Если 1-10 гигабайт данных и компания маленькая ---> обычный postgres.

Вообще, это называется "customer data platform" или "customer 360" за бугром.

Аноним 10/12/24 Втр 19:35:06 № 3338964 205

>>3338922
>А можно ли в одну таблицу уместить все события?
Можно, но скорее всего тормозить будет просто пизда.

Аноним 10/12/24 Втр 20:42:26 № 3338998 206

>>3338960
Я этим вопросом и задаюсь тут >>3338892
> Далее, как именно эти данные будут использоваться?
Я пока писал ответ, подумал, что если есть такая вот единая таблица, то логично с нее все стягивать: список заказов пользователей, номера транзакций при оплате и так далее. Короче все, что должно храниться все время. Набор корзины сюда не входит, но его в целом и не нужно так дотошно трекать. Но почему бы тогда не разбить эту большую таблицу на мелкие. Плюсы следующие - проще структура таблицы, запросы эффективнее, потому то для стягивания истории заказов, мне нужно будет стянуть это только с соответствующей таблицы, не трогая данные с инфой о открытых спорах клиента, истории его платежей и чеков. Но тогда, по идее, задача сводится к базовой в которой не нужно думать о размере таблицы пока в ней ключей меньше чем 100 миллионов. Думаю, что лучше все разбить на разные таблицы с общим ключом event_id, что бы у меня в одном месте была на виду последовательная история события с датами.

Аноним 10/12/24 Втр 20:46:51 № 3339001 207

>>3338998
и в крайнем случае, можно сделать так >>3338901 но уже для каждой таблицы, если подтормаживать будет

Аноним 10/12/24 Втр 21:16:22 № 3339013 208

дата-инженеры есть в треде? расскажите о работе
мимо на обучении на дата инженера

Аноним 10/12/24 Втр 22:05:07 № 3339030 209

>>3338998
Это квадратно-гнездовое мышление. Для 100500 случаев использовать один и тот же подход. Если у тебя аналитика --> можно брать столбцовую бд, типа clickhouse. Если у тебя рекомендации а-ля вы купили синие трусы, вам могут также понравится зеленые --> можно взять графовую бд а-ля Neo4j. Если у тебя временные ряды, имеет смысл взять kibana + logstash + elastricsearch.

То что ты делаешь - это хуяришь всё в одну кучу. У тебя по сути одна бд - она же и швец, и жнец, и на дуде игрец. Реляционные бд не ориентированы на то, что кто-то начнёт хуярить в них временные ряды. Для временных рядов есть специальные бд https://www.influxdata.com/time-series-database/

Короче твой подход - нагружать одну и ту же базу данных разными задачами, пока она не крякнет, не разрастётся до объёмов пока ею невозможно станет пользоваться.

Аноним 10/12/24 Втр 22:14:48 № 3339036 210

>>3339030
С корзиной я соглашусь. Но в остальном то что не так? Это не временные данные, а те которые должны всегда быть доступны по запросу спустя хоть 10 лет. Что не так то?

Аноним 10/12/24 Втр 22:53:00 № 3339057 211

>>3338550
У нас на одном веб сервисе на постгресе есть такая "мусорка", куда все подряд записывается. Логи приложения, какие-то жсоны, хмли, даже пдфы. Разрослась до 300кк записей, почти 150гигов. Поиск по индексам до сих пор отлично работает. Но про какой нибудь like можно забыть.

Аноним 10/12/24 Втр 22:56:26 № 3339058 212

>>3339036
Я уже сказал что не так. У тебя слишком топорный подход. Лично я бы поставил какую-нибудь kafka и слушал изменения в postgres. Когда кто-то что-то покупает, событие выгружается в объектное хранилище с озером данных. Там было бы три папочки - "сырые данные", "обработанные" и "золотые данные", внутри папочки с юзерами и датами. И туда можно лить гугл аналитику, данные из магазина, 1с бухгалтерию, чаты, данные доставки. Данные аггрегируются, очищаются и трансформируются в пайплайне. И на выходе загружается ну допустим в какой-нибудь clickhouse. И от этого можно плясать, уже в кликхаусе я могу узнать допустим когда и сколько раз покупатель заходил на сайт, сколько делал покупок, сколько раз общался в чате, доставила ли товар служба доставки и так далее.

Аноним 10/12/24 Втр 23:07:32 № 3339064 213

>>3339036
>Это не временные данные, а те которые должны всегда быть доступны по запросу спустя хоть 10 лет
https://ru.wikipedia.org/wiki/Временной_ряд

Временной ряд - это просто данные привязанные ко времени. Допустим, термометр считывает температуру каждые 3 секунды и записывает в бд. Или курс акции. Или статус сервера например.

Аноним 10/12/24 Втр 23:18:44 № 3339069 214

Спасибо большое за развернутые ответы на мои глупые вопросы. Аж неожиданно, не похоже на двач

Аноним 11/12/24 Срд 08:35:46 № 3339152 215

>>3339058
>Лично я бы поставил какую-нибудь kafka и слушал изменения в postgres.
Event sourcing хуйня без задач.

Аноним 11/12/24 Срд 08:40:32 № 3339157 216

>>3339030
Buzzword driven development уровня петушиных стартапов. Потом охуеешь искать людей, которые со всем этим говном работали на проде. Нормальные люди ставят постгрю и не выебываются.

Аноним 11/12/24 Срд 09:37:00 № 3339189 217

>>3339152
Толи дело пытаться высрать велосипед на кронджобах и пытаться построить аналитику в приложении лол

Аноним 11/12/24 Срд 09:38:27 № 3339190 218

>>3339157
Видел я этих нормальных, которые на голубом глазу пытались делать очередь поверх постгри и кронджобах

Аноним 11/12/24 Срд 09:45:12 № 3339193 219

Посоветуйте материалов по GreenPlum

Аноним 11/12/24 Срд 12:28:13 № 3339300 220

>>3339157
Ну блять одно и то же... одно и то же... Ноль свежих идей. Как 20 лет назад выучил один подход, так ты его везде и хуяришь. А я плохой, типа посоветовал новый подход. Так может это проблема в тебе, а не во мне. Ты застрял где-то в прошлом и забыл посмотреть на календарь, какой сейчас год.

Аноним 11/12/24 Срд 14:01:05 № 3339367 221

>>3339190
Сага так и делается: таблица в бд и демон. Ты совсем обезумел от базвордов, вангую в тебе фулстека на тупоскрипте.

Аноним 11/12/24 Срд 16:49:41 № 3339507 222

>>3339367
>Сага так и делается: таблица в бд и демон.
Сам ты демон. Чорт блять.

Аноним 11/12/24 Срд 22:58:41 № 3339675 223

>>3339300
>Ноль свежих идей
С примера по Neo4j орнул. Сразу видно долбоеба, который ей никогда не пользовался. Она блядь не строит граф, а ищет по графу. Сам граф должен лично ты руками собирать. Соберешь неправильно - получишь хуйню. Спойлер: ты неделю будешь сидеть получать хуйню, а потом поймешь что твой юзкейс в принципе в графовую модель не вписывается. Сопутка из твоего примера как раз не вписывается. Там слишком много условий: одни бренды не хотят чтобы их показывали под другими, другие наоборот башляют чтобы быть всегда и везде. А как только пошли условия вся эта графовая залупа валится как карточный домик. Оно хорошо работает когда есть четкая одноранговая связь А - Б, ну то есть почти никогда.

И то не говоря что все запросы на этом ебаном птичьем языке придется самому написать, ручками. А для того чтобы привязать что-то к чему-то надо, внезапно, знать что есть что-то к чему можно привязаться блядь. То есть это чисто вторичная база для вычислений, и должна быть исходная.

Короче ебли с греблей там ебнешься. При этом далеко не факт что результат будет быстрее чем поставить какой-нибудь Apache AGE на постгрес и мозги не ебать.

Аноним 12/12/24 Чтв 08:54:35 № 3339791 224

Какой у вас темп чтения? Сколько за день читаете страниц?
У меня со скрипом идет пиздец, на 104 странице и далее, оперативка трещит по швам, отвлекаться на все начинаю

Аноним 12/12/24 Чтв 09:12:20 № 3339796 225

>>3339791
Это про клеппмана

Аноним 12/12/24 Чтв 11:15:44 № 3339860 226

>>3339791
Так а нахуя ты справочную литературу как беллетристику читаешь?
Ты бы еще таблицы брадеса по сто страниц в день читал. Пиздец, что отсутствие нормального образования с людьми делает.

Аноним 12/12/24 Чтв 11:21:21 № 3339868 227

>>3339860
А как тогда читать Кабанов?

Аноним 12/12/24 Чтв 11:30:07 № 3339874 228

>>3339868
Ты в школе учился? Как ты учебник по математике читал? Открывал и хуярил пока не заснешь?

Аноним 12/12/24 Чтв 11:43:20 № 3339878 229

>>3339874
У тебя проблемы с восприятием текста в вопросе?

Аноним 12/12/24 Чтв 11:52:53 № 3339881 230

>>3339878
А у тебя?

Аноним 12/12/24 Чтв 12:02:24 № 3339889 231

>>3339881
У меня все отлично, а ты прямые вопросы игнорируешь - лови репорт, малолетний, за шитпостинг и оффтоп

Аноним 12/12/24 Чтв 12:45:14 № 3339927 232

17244497226690.mp4 435Кб, 432x232, 00:00:05

>>3339889
Нормально ты сам себя приложил.
Если я шитпостер и тролль, то ты тупорылый еблан, который не осилил сто тсраниц текста прочитать.
А если я прав, то ты тупорылый еблан, который не умеет работать с учебной литературой и информацией.

Аноним 12/12/24 Чтв 12:59:04 № 3339939 233

изображение.png 85Кб, 777x188

>>3339927
Аутист-графоман не ответил ни на один вопрос но продолжает растягивать диалог требуя к себе внимания. Друзей наверное нет, а общение хочется? Плак плак, потребуй еще уделить тебе внимание, маленький

Аноним 12/12/24 Чтв 13:28:34 № 3339955 234

>>3339939
Ну да, это же я прибежал в базотред справшивать как книжки чиатать. А когда мне намекнули что этому базовому навыку обучаются в шкиле, порвался и закатил истерику.

Пора взрослеть. Аноны не твоя мамка. И на твои истерики и ультиматумы что-то для тебя сделать, просто проведут тебе шершавым по губам.

Аноним 12/12/24 Чтв 13:38:55 № 3339959 235

>>3339955
Хуя, графоман пробзделся, наверное что-то интересное написал? Нет - вангую там нет ответов на мои вопросы, поэтому даже читать не буду, лучше лишний раз репортну задрота с ручками-веточками без друзей

Аноним 13/12/24 Птн 20:59:46 № 3340811 236

>>3339955
Че дебил, ты по факту дебил соснул - дочитал до 136 страницы и там как раз все базируется на первых главах, на базовых структурах в теме про колоночные БД ссылается на ss-таблицы из первых глав.

Так что ты по факту дебил который обосрался. ПО ФАКТУ ДЕБИЛ

Ну и я мать твою ебал и весь твой род за то что мое время воровал, чмошник

Спасибо поел Аноним 15/12/24 Вск 03:15:11 № 3341454 237

один предлагает аналитику собирать через бэкенд другой поциент ему втирает биг дата дрисню. Тот не понимает что за хуйня происходит другой уже ебнулся от калпоративных хранилищ и не может вдуплить чзх

другой поциент спрашивает как он сука быстро читает, как будто в ебаной началке чекает скорочтение ёбаное на что ему другой анон справедливо замечает, но поциент начинает ссылаться к какому-то содержанию этой хуйни с каким то там сука ss(нацист бля что ли?) пиздец - деды воевали так-то

Аноним 16/12/24 Пнд 10:04:24 № 3342226 238

Анон, помогли, пожалуйста, с задачей. Нужно сделать фильтрацию выручки по типам оплаты. Выручка считается по чекам в таблице check. С чеками связаны транзакции, в которых хранится информация об оплате (также стоимость чека хранится в самом чеке). Транзакции могут быть разных типов (наличные, безналичные и так далее). Транзакции хранятся в таблице pay_transaction, тип транзакции - в таблице payment_type.
Считать выручку мешают смешанные чеки. Смешанные чеки - это чеки, оплаченные несколькими видами оплаты. Например, наличными и безналичными. Для таких чеков создаются несколько транзакций разных типов. Чтобы определить тип чека (смешанный или простой) я считаю количество транзакций разных типов. Если это число больше, то чек смешанный.
Но смешанных чеков в природе не существует. Это просто чеки, оплаченные разными видами оплаты. И наличная и безналичная части этого чека должны идти в соответствующие категории выручки (в категорий налички или безналичного расчета). Как это можно сделать?

Я придумал для простых чеков считать выручку на основании полей check.total_with_discount и check.total. Это правильно. Но со смешанными чеками все сложнее. При подсчете, например, выручки наличными, нельзя просто взять и прибавить стоимость смешанного чека, потому что она общая. Нужно взять из транзакции нужного типа (наличка) количество оплаты и присуммировать к общей выручке.

Как это можно реализовать? Я уже запутался. Логика сложная. Мешает то, что при джойне таблиц с транзакциями строки с чеками дублируются и их приходится группировать, чтобы удалить дубликаты. С агрегаций и группировкой в этой запросе вообще проблемы.

Аноним 16/12/24 Пнд 10:06:33 № 3342228 239

Снимок экрана 2[...].png 70Кб, 1306x403

>>3342226

Аноним 16/12/24 Пнд 12:50:45 № 3342375 240

>>3342226
> Выручка считается по чекам
Здесь ошибка. Выручка считается по транзакциям. А чеки нужны только чтобы определить список транзакций. Зачем тебе вообще чек, чтобы определить плюсовать сумму в нал или в безнал? Если ты просто возьмешь все транзакции, то часть из них будет нал, а часть безнал. Обе суммы считаются оконной функцией в один проход.

Для начала набросай структуру таблиц и тестовые данные https://dbfiddle.uk/QaP5BhZ0 Без этого все равно говорить не о чем.

Аноним 16/12/24 Пнд 21:35:19 № 3342763 241

>>3342226
>датагрип
ёбаный стыд, есть же дбивер

Аноним 17/12/24 Втр 20:24:58 № 3343457 242

Не опасно ли в одной таблице хранить данные от разных пользователей? С одной стороны понимаю, что если id проверяется, то пользователь к чужим данным доступ не получит, но все равно как то стремно, что единственное, что огрничивает пользователя от чтения чужих данных - его ид

Аноним 17/12/24 Втр 20:57:06 № 3343482 243

>>3343457
Так-то можно продолжить это "стрёмно" и в итоге решить, что для каждого пользователя должна быть своя независимая БД на выделенном сервере.
Ограничивает от чтения чужих данных не id, а прямота твоих рук, когда ты пишешь код с реализацией разграничения доступа. К примеру, нельзя доверять id, присланному с клиента, вместо этого надо его брать из пользовательской сессии или из подписанного токена.

Аноним 17/12/24 Втр 21:31:22 № 3343498 244

>>3343482
> Так-то можно продолжить это "стрёмно" и в итоге решить, что для каждого пользователя должна быть своя независимая БД на выделенном сервере.
Но только это никак не улучшает ситуацию.
> Ограничивает от чтения чужих данных не id, а прямота твоих рук, когда ты пишешь код с реализацией разграничения доступа.
> К примеру, нельзя доверять id, присланному с клиента, вместо этого надо его брать из пользовательской сессии или из подписанного токена.
Да, это понятно. Но все равно ошибки случаются. Хотелось бы, чтобы был какой то доп уровень безопасности, усложняющий написание кода с такими дорогими ошбиками

Аноним 17/12/24 Втр 21:56:40 № 3343507 245

>>3343457
>Не опасно ли в одной таблице хранить данные от разных пользователей?
А ты данные ШИФРУЕШЬ? Если да, то почему это должно быть опасно..? И што тогда произойдёт... ну окей... ну кто-то получил данные... там всё зашифровано... иииииии? А если не шифруешь, значит ты сам еблан и полностью заслуживаешь, чтобы у тебя спиздили данные, на твоих клиентов оформили кредиты, вывели бабло в крипту и ты мучался бегая по судам. Ты заслужил хорошую хакерскую атаку, мне тебя не жалко будет, пускай ты красный как помидор будешь решать, стоит ли говорить пользователям об утечке? Неее лучше сделаем вид, что ничего не произошло. Я уже имел дело с такими как ты, пока в жопу петух не клюнет, погроммист не спохватится.

Аноним 17/12/24 Втр 22:01:20 № 3343508 246

>>3343507
Слишком толсто.

Аноним 17/12/24 Втр 22:09:49 № 3343513 247

>>3343508
Ты-то штоль? Ну ты жиробас это 100%.

Аноним 17/12/24 Втр 22:59:32 № 3343534 248

>>3343507
охуенная идея все зашифровать, чтобы не только какеры, но и я сам не мог ничего прочитать

Аноним 17/12/24 Втр 23:20:47 № 3343540 249

>>3343534
Это на самом деле не прикол. В европе так по GDPR работают. Все личные данные зашифрованы персональным ключем пользователя. И когда пользователь требует всю личную информацию удалить, то вместо того чтобы бегать по всей системе и всем хранилищам ища эти данные, просто выкидывается ключ шифрования. А без ключа остаются обеличенные идентификаторы и зашифрованная тарабарщина.

Аноним 17/12/24 Втр 23:31:13 № 3343542 250

>>3343534
Ну давай тогда ничего не будем шифровать. Нахуй вообще придумали шифрование - давай все оставим открытым. Потому что какому-то программуле было лень ебаться, лень придумывать схемы как сохранить/восстановить данные если чо, лень читать про шифры. И вообще, самая правильная идея - это положиться на авось. Авось пронесёт. Я же 10 лет работаю и вообще ни разу не ломали! Да кому это надо! Да какое хакерство, камон в 2024-м году лул! Но почему-то данные ШЕСТДЕСЯТ СУКА ПРОЦЕНТОВ российских компаний уже слиты в даркнет. Они также думали АХАХАХ ЛОХИ, да кто нас будет ломать, кому мы нужны. В итоге их и наебали.

Аноним 18/12/24 Срд 00:48:28 № 3343573 251

Пытаюсь построить конкурентный межпроцессный обмен на sqlite. Организовано так: несколько процессов дёргают 1 файл, расположенный в озу (tmpfs, linux). ПРАГМЫ такие:
>journal_mode=WAL
>synchronous=0
>temp_store=MEMORY
Работает кое-как... Пока до производительности не дошло, но уже сейчас, при каких-то 10fps выскакивает 'database is locked' (который в одном из случаев исчезает после того, как я UPDATE и SELECT в коде поменял местами... что это было?). Но, кроме того, неимоверно растёт -wal файл, который sqlite держит рядом с базой данных. Никакие wal_checkpoint, wal_autocheckpoint, journal_size_limit не помогают. За секунды может нажрать МБ, хотя исходная 20КБ-база содержит 5 записей и одну таблицу. Растёт бесконечно, короче, и ОЧЕНЬ быстро!
Есть шансы довести всё это до ума? Это я ещё windows не брал, где нет ОЗУ-шной ФС, и надо что-то городить платформенное... А мне нужно КРОСС обязательно, или хотя бы linux.

Вообще, насколько здраво использовать sql как хранилище переменных, критичных к real-time? Если мне нужно забрать статус определённой, быстро ли будет осуществлён доступ к ней по имени? Типа "SELECT value FROM state WHERE name='position';". Потом fetch всякие.

Аноним 18/12/24 Срд 00:52:06 № 3343574 252

SQL удобен, потому что мне не только переменные дёргать, но и определённую структуру выстроить, что во всяких redis/memcached не реализовано. Именно переменные для краевого случая я привёл в пример. Кроме того, сам язык SQL предпочтителен как везде и всеми понимаемый, универсальный.

Аноним 18/12/24 Срд 01:08:07 № 3343578 253

>>3343540
>>3343542
Ебать вы дауны. Вы не вникая в суть вопроса хуйни понаписали которая в голову пришла, чтобы умными показаться. Второму я отвечать не буду даже, первый хоть в нормальном тоне +- адекватную мысль написал, которая все равно не относится к вопросу. Но ему я отвечу. То, что ты предлагаешь, не решает мою проблему. У тебя все равно при запросе от пользователя будет поход в бд ключей, там по ид пользователя достанется ключ и им остальные данные расшифруются. Моя проблема полностью не решилась. Если бд только записывает, а потом возвращает пользователю его данные, то ок - в случае чего он получит мусор. Но если бд еще что то делает с данными, то это не поможет. Если я допущу ошибку и у меня будет криво выбираться id, то бд будет криво расшифровывать и записывать чушь. Это не решение проблемы. Мой вопрос про минимизацию допуска такой ошибки.

Аноним 18/12/24 Срд 02:04:33 № 3343589 254

>>3343578
Чел, перед тем как вываливать свой гонор ты бы почитал что такое асимметричное шифрование. Приватного ключа у владельца базы может вообще не быть, прикинь? В базе хранится абракадабра, котроая может быть расшифрована только на клиенте. И сохранность приватного ключа это головняк самого клиента. Где он там у него храниться будет: на флешке, на хуешке, в сейфе - хоста базы это не ебет.

Тебя чет как-то во всей твоей "безопасной" схеме не смутило, что если такой тупорогий долбоеб как ты свое жало в таблицу пилит, то данные уже скомпрометированы.

Аноним 18/12/24 Срд 02:27:53 № 3343590 255

>>3343589
>В базе хранится абракадабра, котроая может быть расшифрована только на клиенте
В таком случае моего вопроса не было бы, даун

Аноним 18/12/24 Срд 03:11:00 № 3343603 256

>>3268780 (OP)
> Q: Где хранить файлы?
> A: Не в БД. Для этого есть объектные хранилища, такие как Amazon S3 и Ceph.
Поясните, в чём будет проблема если я как гит насру жиденько файлами в файловую систему, только не по 50 килобайт, а по 500 мегабайт, и отсортирую их по хешам чтобы папки не перегружать, а в бд буду хранить, собственно, хеш?

Аноним 18/12/24 Срд 03:15:39 № 3343605 257

>>3343590
Ну а какие еще вопросы могут быть у ебаната, который путает базу и приложение. То что ты назваешь "пользователями" это пользователи приложения, а не базы. И доступ к данным регламентирует приложение.

В самой-то базе можно настроить доступ каждому пользователю базы хоть построчно. Только ты коннектишь свое приложение к базе через единственного пользователя, а потом че-то пердишь про безопасность.

Аноним 18/12/24 Срд 03:23:07 № 3343607 258

>>3343605
>И доступ к данным регламентирует приложение.
я это понимаю. но страшно, что на уровне бд нет доп подстраховок. И если я случайно проебался и по какой то причине отдал в бд запрос "выбрать все заказы с дилдаками где id пользователя = uid " чужой uid, то оно так и отправится. Понятно, что данные надо проверять, но от багов никто не защищён на 100%. В связи с этимм вопрос, нельзя ли придумать еще какой то уровень защиты от выдачи не тех данных пользователю?

Аноним 18/12/24 Срд 03:32:08 № 3343608 259

>>3343607
Почему авторизованный доступ к данным должен на уровне субд проверяться? Это зависит от логики приложения. В одном случае у тебя в приложении данные по пользователям разделяются, а в другом случае по организациям или подразделениям и т. д.. В СУБД должны быть объекты твоей предметной области?

Аноним 18/12/24 Срд 03:36:48 № 3343609 260

>>3343608
ладно, я понял. нет способа. значит придётся 100 раз вместо 10 проверять корректность передачи запросов к бд и аргументов к ним. спасибо

Аноним 18/12/24 Срд 03:41:37 № 3343610 261

>>3343609
Просто погугли как обычно в веб приложениях делается RBAC

Аноним 18/12/24 Срд 03:43:55 № 3343611 262

>>3343610
спасибо

Аноним 18/12/24 Срд 13:20:20 № 3343943 263

>>3343578
>Это не решение проблемы. Мой вопрос про минимизацию допуска такой ошибки.
Естественно! Там комплексно надо подходить. В облаках есть правила, можно тонко прописать кто может читать/записывать, какие поля и так далее https://dev.mysql.com/doc/refman/8.4/en/grant.html#grant-column-privileges А в NoSQL можно прописать чтобы пользователь имел доступ только к своим данным https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/specifying-conditions.html#FGAC_DDB.ConditionKeys

Конечно это всё вместе надо использовать:
шифрование + права доступа + санитизация полей + мультифакторная аутентификация
И так далее.

Аноним 18/12/24 Срд 13:32:28 № 3343947 264

>>3343603
>отсортирую их по хешам чтобы папки не перегружать, а в бд буду хранить, собственно, хеш?
Бля это классическая ошибка. Хеши это ненадёжный способ ссылки на файл. Во-первых, у файлов есть метадата. Если ты предположим, открыл файл, у него меняется "last access date" и всё, хеш другой совсем. Тоже самое "created on" - один и тот же файл созданный в разное время имеет разный хеш. Во-вторых, хеши для картинок бесполезны. Две картинки могут быть визуально одинаковы, но иметь разный формат - один jpeg, другой png. И хеши у них будут разные. И в-третьих, тогда получается что у них будут вместо имен файлов хеши. Ну это будет тупо мусорка, файлопомойка, если файлов много, то будешь их миллион лет сортировать.

Аноним 18/12/24 Срд 15:09:43 № 3344031 265

>>3343607
>В самой-то базе можно настроить доступ каждому пользователю базы хоть построчно.
>страшно, что на уровне бд нет доп подстраховок

Аноним 18/12/24 Срд 15:34:10 № 3344048 266

>>3343947
Ну и нахуя ты пиздишь? Буквально все что ты написал это неправда.

1) Метаданные типа времени создания хранятся не в файле а в ОС.
2) Функции хеширования прекрасно знают что захешировать нужно именно бинарное тело файла.
3) JPEG и PNG это разные файлы. У них не только тип отличается, у них структура хранения информации о пикселях отличается. Это такая феерическая чушь. Все равно что утверждать что все фото Тадж-Махала это дубликаты, потому что визуально одинаковы.
4) Про сортировку тоже хуйня написана. Если книги ставить на полку по одной, упорядочивая по первым буквам названия, полка будет заполнена отсортированными книгами, хотя никто ВСЮ полку никогда не сортировал.

Про хэш можно простой логикой дойти. Есди это работает так как ты написал, то как вообще тогда возможна проверка файла по хешу? Вот на сайте микрософта лежат образы винды и хеши для проверки. Как такая проверка возможна если при попадании этих образов в твою ОС у них creation date проставляется и они "меняются"? А если у jpeg и png одинаковое тело, то нахуй тогда png придумали? От нехуй делать?

Аноним 18/12/24 Срд 16:15:45 № 3344081 267

>>3344031
Так никто не делает. Исключение какие-нибудь дешевые шаред- хостинги настраивают права пользователя phpmyadmin для кадого клиента, но все клиенты хостинга сидят в одной СУБД. В данном случает подключение phpmyadmin к mysql зависит от пользователя

В остальном везде пользователь для подключения к БД один на приложение или микросервис (или несколько если есть разделение на администраторский аккаунт и само приложение). Подключение не зависит от пользователя работающего с приложением

Авторизация доступа реализуется приложением . Обычная реализация:
1) У таблиц есть owner_id или department_id или аналогичное. Когда пользователь аутентифицирован, в сесси хранится нужный ID для фильтрации данных, он извлекается из сесси и добавляется к каждому запросу в WHERE
2) RBAC
3) Если есть иерархия организация - подразделение - сотрудник, то RBAC проверяется по всей иерархии

мимо

Аноним 18/12/24 Срд 16:19:55 № 3344086 268

>>3344081
Тред не читал, но влезть в разговор и высраться надо? Я выше тоже самое написал, додик.

Аноним 19/12/24 Чтв 04:37:56 № 3344499 269

А нахуй вы тут все нужны-то? В век нейросетей + облаков. Лол. Не позорьтесь — закрывайте тред.

Аноним 19/12/24 Чтв 09:19:35 № 3344577 270

>>3344499
Ну как же? Без нас тебе бы некуда было прийти и высрать свой шитпост.

Аноним 19/12/24 Чтв 19:24:56 № 3345168 271

>>3339013
расскажи что изучаешь, в каких пропорциях? какой роадмап? я тоже вкатун

Аноним 19/12/24 Чтв 19:54:27 № 3345184 272

>>3345168
Где учишься?
мимо-вкатун-с-оффером

Аноним 19/12/24 Чтв 20:17:57 № 3345202 273

>>3345184
Вы же будете меня унижать морально.
На степике. Прошёл несколько курсов по питону, сейчас добавил SQL и линукс. Учусь 2 месяца.

Аноним 19/12/24 Чтв 21:35:12 № 3345246 274

>>3345168
>>3345184
sapience solutions
входные данные - знание sql
учат гринплюму, pxf/gpfdist, airflow, clickhouse, superset
это бесплатное обучение, если норм всё - берут на стажировку 50к в москве очно, я к сожалению мухосранск-боярин и поехать не смогу банально жить негде
магистратура 1 курс

Аноним 19/12/24 Чтв 22:53:52 № 3345278 275

>>3345246
Хуйня какая-то. Ты еще в Астон блять иди в рабство. Есть же курсы у иннотеха, у неофлекс, еще у кого-то, где можно сразу на норм работу залететь.

Аноним 20/12/24 Птн 08:15:52 № 3345401 276

>>3345278
>астон
ебать я там был, на джаву учился, а потом ученический договор на N лет иначе штраф 500к-1кк
> иннотеха, у неофлекс
спасибо, гляну

Аноним 20/12/24 Птн 13:35:52 № 3345737 277

>>3345401
И как ты выкрутился? Отработал 5 лет за 30к оклада?

Аноним 20/12/24 Птн 16:49:27 № 3345938 278

А куда вы тута вкатываетесь вообще? В разрабов?

Аноним 20/12/24 Птн 17:38:05 № 3346015 279

>>3345938
В бэкендеров, разрабов БД, разного рода аналитиков, дата-инженеров, ДБА и всех, кому хоть как-то нужно работать с базами данных.

Аноним 21/12/24 Суб 14:20:47 № 3346506 280

>>3346015
А кому щас админы нужны, когда все компашки мигрируют в облако? Ну, разве что кроме госух, которые владеют слишком "важными" данными, поэтому опасно использовать третьи руки. Но и зп в госухе максимум 50к.

Ладно, может ещё не все мигрировали, но это активно происходит. Достаточно взглянуть на кол-во вакансий. Уже через год их останется ~100 шт на всю Россию. Это пиздец какая конкуренция там. И пиздец как мало работы. Либо ты становишься DBOPS/DevOps, либо пиздуешь на мороз жаловаться на несправедливость.

Это я к чему? Не надо катиться в ходячий труп, это все равно что хачкель учить.

Аноним 21/12/24 Суб 16:56:43 № 3346623 281

>>3346506
а куда вкатываться?

Аноним 21/12/24 Суб 21:15:47 № 3346848 282

>>3346623
Да хуй знает. Я в аналитики качусь. А ты куда хошь. Если тебе админство по душе, то и там наверное найдёшь работу. Думаю переход займёт ещё 3-5 лет. Если за это время успеть стать хотя бы мидловым или даже синьорским админом, то проблем с работой точно не будет. Другой вопрос, а как стать-то таковым? В девопс/сисадминстве-то понятно, там много инфы есть. А по дба по сути пара толковых книг всего. Тут надо 100% высасывать опыт у своих старших коллег, иначе не прокачаешься нихуя и так и останешься джуном. А джунам в будущем работы не будет в дба.

Аноним 21/12/24 Суб 21:25:51 № 3346857 283

>>3346506
Интересно, если бы я не упомянул ДБА, ты бы стал строчить эту бессмысленную простыню?

Аноним 21/12/24 Суб 22:45:15 № 3346880 284

>>3346848
я в дата инженеры или дата аналитики хочу

Аноним 21/12/24 Суб 23:31:03 № 3346893 285

>>3346857
> бессмысленную
В каком месте? Я предостерегаю анонов от необдуманных решений.

>>3346880
Хорош. Твоя жизнь уже удалась.

Аноним 22/12/24 Вск 12:27:02 № 3347148 286

>>3346893
Хуйню не неси, дурачок, люди обучаются и нормально находят работу в дате.
Блять что на форумах, что на ютубе такую хуету несут люди, которая вообще не соотносится с реальностью, я не перестаю ахуевать

Аноним 22/12/24 Вск 14:50:34 № 3347233 287

>>3347148
Я и не про дата писал. Внимательнее читай.

Аноним 22/12/24 Вск 20:03:28 № 3347429 288

бля мужики какая охуенная книга это фантастика
посоветуете ещё что нибудь от oreilly, доверяю только им
пытаюсь в дата-инженера

Аноним 22/12/24 Вск 21:05:49 № 3347493 289

>>3347429
>дата-инженера
А они там не на Питухоне барахтаются с Pandasами всякими? Эскюлэл это конечно база

Аноним 22/12/24 Вск 21:12:01 № 3347505 290

>>3347493
не, это аналитики в пандас ковыряются, дата-инженеры калопроводы строят и чистят вилкой кал от null значений и дубликатов

Аноним 22/12/24 Вск 21:22:21 № 3347516 291

>>3347429
В чем ахуенность?

Аноним 22/12/24 Вск 21:36:42 № 3347529 292

>>3347516
легко читается + хорошо расписано, всё таки не индусами написана
есть ОГРОМНЫЙ МИНУС - базируется на mysql по большей части, хотя другие диалекты тоже представлены
постгре нет
я не с нуля правда, может поэтому хорошо читается

Аноним 22/12/24 Вск 21:46:52 № 3347535 293

>>3347529
А как насчет практики? Где и как?

Аноним 22/12/24 Вск 22:11:58 № 3347551 294

>>3347535
есть задания но крайне немного, но САМАЯ ЛУЧШАЯ ПРАКТИКА НА ПЕРИОД 2025 ГОДА -
https://karpov.courses/simulator-sql
почти единственная бесплатная хуйня, карпов вообще нормальный мужик с нормальными курсами но платно нахуй надо
150 мега-годных задач похожих на реальные, есть теория (но лучше из несокльких источников черпать)
у него ещё по матану есть бесплатный курс, тоже норм

Аноним 23/12/24 Пнд 00:45:56 № 3347620 295

Как ответственный человек, я хочу делать бекапы данных, однако, для меня критично, чтобы после каждой операции записи в бд, ее копия также изменялась на втором диске, чтобы в случае, если 1 диск наебнется, я мог со второго загрузить бд и повторно такую же схему настроить. Какая бд умеет в такое? Или мне нужно иначе дублировать операции записи на 2 диска средствами ос? Но я не хочу целые диски дублировать, а только дб - максимум, раздел. Советы?

Аноним 23/12/24 Пнд 01:17:01 № 3347632 296

>>3347620
Через ZFS можно настроить реплицирование только БД. Но ZFS работает на уровне файловой системы, а не на уровне логических транзакций базы данных, как это делают встроенные механизмы репликации в СУБД.

Например, для PostgreSQL репликация через WAL (аналог binlog в MySQL). Можно ещё использовать логическую репликацию, если нужно обновлять данные только отдельных таблиц.

Репликацию можно сделать синхронной и асинхронной. Синхронная обеспечивает, что транзакция будет завершена только после подтверждения записи на реплике. Асинхронная такого не гарантирует, поэтому в момент сбоя данные на 1 диске могут не успеть обновиться. Зато такой вариант быстрее. Выбирай по задачам.

Аноним 23/12/24 Пнд 01:29:47 № 3347640 297

>>3347632
Мне нужна синхронная репликация, желательно на уровне логических транзакций. Я еще нагуглил cockroachdb. Выглядит супер круто и удобно, однако там предполагается, что всегда должен быть консенсус и если он все таки нарушился, то восстанавливаться нужно из бекапа. А это мне не очень подходит, потому что
1) как я понял, там бекап это скорее что то, что руками запускается раз в сутки, а бекапить на другой диск после каждой транзакци оно не умеет
2) если все таки без бекапов а через консенсус делать, то нужно поднимать минимум 3 ноды (иначе если 1 наебнется, то пизда всему кластеру), что для меня излишне

Аноним 23/12/24 Пнд 01:54:22 № 3347643 298

Хотя мне очень нравится cockroachdb тем, что там уже по умолчанию все настроено для максимальной надежности, а значит меньше шанс проебаться.

Аноним 23/12/24 Пнд 02:22:50 № 3347646 299

Короче, хотелось бы услышать советы какую бд выбрать. Нужна гарантия ACID, serializable isolation, логическая синхронная репликация.

Аноним 23/12/24 Пнд 02:34:19 № 3347648 300

При этом среди нескольких подходящих, лучше та, в которой все это легче всего настроить

Аноним 23/12/24 Пнд 03:41:15 № 3347659 301

Погуглил. Понял, что можно не выебываться и взять postgresql. Там транзакции и wal есть. Правда мне кажется странным, что уровень изоляции транзакции задается явно для каждой транзакции, а не глобально, но ладно. Может я пока еще не нашел способа явно задать, а это реально. Теперь по поводу wal. Можно 2 диска через mdadm в рейд объеденить и туда лог писать. Тогда, если 1 диск накроется, со второго можно будет восстановиться. Однако есть "но". Я боюсь, что в реале диске (особенно ссд) ломаются чуть сложнее чем просто "был идеальный диск с 100% целыми данными, а потом резко mdadm увидел, что диску пизда и перестал всё писать". Вдруг mdadm будет считать здоровым диск на котором уже данные начали херится? Тогда, когда у меня один наебнется окончательно, я охуею, когда начну читать данные со второго диска и увижу, что там половины данных нет. Такого не может быть?

Аноним 23/12/24 Пнд 03:56:02 № 3347663 302

Интересно, что будет, если во время работы 1 диск из двух наебнется. Как postgresql будет себя вести?

Аноним 23/12/24 Пнд 04:21:38 № 3347667 303

>>3347659
>Понял, что можно не выебываться и взять postgresql.
Правильно понял. Постгря - это охуительный комбайн с охуительным комьюнити, там есть все. Если чего-то нет, это скоро появится, как когда-то было с jsonb. Пока небинарные долбоебы тащат в проекты всякую новомодную хуиту, нормальные люди ставят постгрю и спокойно работают.

Аноним 23/12/24 Пнд 20:20:39 № 3348397 304

Какую субд выбрать под соло-разработку коммерческих сайтов, руководствуясь лицензионными соображениями?

Постргю, как слышал, тяжелее администрировать, зато полностью свободная и полно инфы по ней. Только фичи продвинутые мне не нужны.
Мускл - непонятная лицензия, но в остальном кажется тем, что надо. Простая, ничего лишнего.
МариаДБ вроде как лишена недостатка второй, но комьюнити маленькое и хз в каких моментах может всплыть не 100% совместимость с библиотеками фреймворка. Стремновато.

Оракл не пристанет с требованием плотить, если в закрытых проектах с прибылью юзать мускл?

Аноним 23/12/24 Пнд 20:46:13 № 3348421 305

>>3348397
>Мускл
Это че?

Аноним 23/12/24 Пнд 23:28:14 № 3348531 306

>>3348397
> Только фичи продвинутые мне не нужны.

Хватит хуйнёй страдать, братиш. Ты слишком много времени тратишь на сомнения. Просто бери постгре и всё.

Я так понял, у тебя что-то не шибко крупное. Для простых задач можно использовать минимальную настройку, и норм всё будет. Инфы по ней полно, всё настроишь с полпинка.

Аноним 24/12/24 Втр 00:17:10 № 3348549 307

>>3348531
Я не понимаю откуда вы берете эти "настройки"? Из статей 2007 года? Какие нахуй настройки? Че ты там настраивать собрался? Ставишь контейнер с последней версией, прописываешь доступы и погнал. Настройщики ебать.

Аноним 24/12/24 Втр 00:21:43 № 3348550 308

>>3348549
Макака, спок

Аноним 24/12/24 Втр 00:44:25 № 3348553 309

>>3348397
Постгю бери. Мускуль и Мария нужны для скуф-проектов и скуф-стека.

Аноним 24/12/24 Втр 00:58:40 № 3348560 310

>>3348553
Значит, на пхп пишут одни скуфы?)

Аноним 24/12/24 Втр 02:00:12 № 3348569 311

Снимок экрана 2[...].jpg 139Кб, 1106x793

Снимок экрана 2[...].jpg 100Кб, 1118x732

>>3268780 (OP)
Бля, какой пиздец (про книгу кабаны, клеппман) - ОШИБКИ В ГРАФИКАХ + всратый перевод в некоторых частях, если вбить то же предложение в гугл транслейт - то появляется человеческий текст.

Книги короче проще через гугл прогонять, чем читать такой наеб

Аноним 24/12/24 Втр 02:01:18 № 3348570 312

Снимок экрана 2[...].jpg 159Кб, 1053x736

>>3348569
Как же я рад что не купил бумажную. Будете ли вы требовать возврат от этих петушониксов?

Аноним 24/12/24 Втр 02:01:48 № 3348571 313

>>3348570
Переводчик-то петух

Обыкновенную мухоловку исключили из Красной книги Украины Аноним 24/12/24 Втр 03:06:05 № 3348582 314

Хуя подрыв дупы у вкатыша. Расслабься, мы поняли, что ты молодец и учишься. Будешь успешен когда-нибудь.

Аноним 24/12/24 Втр 03:07:08 № 3348584 315

КОМУ ВАШИ БД ВСРАЛИСЬ-ТО???? ВСЕ УШЛИ В ОБЛАКА ДАВНО! НИКТО ИЗ ВАС БОЛЬШЕ НЕ ТРЕБУЕТСЯ! СБЕРБАНК РАЗРАБОТАЛ НОВУЮ СИСТЕМУ КРУЧЕ 1С И SAP, А ВЫ ВСЕ ЛОХИ!!!!!!!!!!!!!!

Аноним 24/12/24 Втр 03:34:57 № 3348588 316

17336584186010.mp4 4148Кб, 420x236, 00:00:09

>>3348584

Аноним 24/12/24 Втр 06:42:03 № 3348634 317

>>3348584
> КОМУ ВАШИ БД ВСРАЛИСЬ-ТО???? ВСЕ УШЛИ В ОБЛАКА ДАВНО!
Что, БД в облаке перестала быть БД?
> НИКТО ИЗ ВАС БОЛЬШЕ НЕ ТРЕБУЕТСЯ!
Анон с двача и раньше был никому не нужен.
> СБЕРБАНК
Это который настолько не доверяет чужим облакам, что скорее потратит очередной миллиард деняк на содержание своих дата-центров, чем развернёт даже самый бесполезный сервис у вендора?
> РАЗРАБОТАЛ НОВУЮ СИСТЕМУ КРУЧЕ 1С И SAP
Но сам при этом не перестал юзать ни 1С, ни SAP.

Аноним 24/12/24 Втр 13:32:48 № 3348890 318

>>3321130
GTID, Orchestrator, ProxySQL

Аноним 24/12/24 Втр 15:34:12 № 3349045 319

>>3348588
олег тинькоф всегда веселит

Аноним 24/12/24 Втр 15:48:43 № 3349059 320

>>3348553
>для скуф-проектов и скуф-стека
Я и говорю: то, что надо.

Аноним 24/12/24 Втр 19:27:41 № 3349251 321

image.png 38Кб, 1576x376

Указал зп ниже 60к, даже так не взяли, хотя написал что опыт работы с бд есть. Ну и как мне вкатиться в ваше DBA? Или по возрасту кикнули — 29 лвл. Типа слишком старый и ещё и на ждуна хочет, лох какой-то. Так что ли блять??

В ответе мне написали "Большое спасибо за интерес к вакансии! К сожалению, сейчас мы не готовы пригласить вас на следующий этап.
Ценим ваше внимание и будем рады получать ваши отклики на другие позиции."

Аноним 24/12/24 Втр 19:30:07 № 3349254 322

Шо мне крутануть 1.5 года что ль? Потом меня в чс добавят и ваще никуда не устроюсь. А рынок DBA очень маленький, это ж цэ кiнец буит для мну...

Аноним 24/12/24 Втр 19:59:40 № 3349271 323

Или может сразу в девопс катиться тогда? Там и вакансий побольше. Я так-то уже много по PostgreSQL прошёл, жалко как-то поворачивать назад. Какие мысли, кочаны?

Аноним 24/12/24 Втр 20:15:44 № 3349289 324

>>3349251
>Указал зп ниже 60к, даже так не взяли
Если думаешь, что можешь перебить зарплатой - то нет. Всегда найдётся чел дешевле тебя, готовый работать ну хоть за еду, ну хоть за отзыв. У нас в стране дохера чмошников, готовых за опыт унижаться.

Там уже было дохера претендентов и отказать могли из-за чего угодно. Не надо рефлексировать. Отказали и отказали, на автоматизме закрыл вкладку и пошёл дальше искать работу. Всё. Нечего обсуждать. Если ты будешь рефлексировать по каждому поводу "а почему?", "а как?", то и в 35 лет ты также будешь безработным.

Аноним 24/12/24 Втр 20:23:39 № 3349295 325

>>3349271
>Там и вакансий побольше.
Плохому танцору всегда что-то мешает. Если так сливаться, то никакая вакансия тебе не подойдёт. Представь, что я хочу стать музыкантом, беру в руки гитару и после первой неудачи говорю "ой чёто гитара слишком сложная, лучше попробую виолончель". Потом c виолончелью тоже не получилось... лучше попробую баян. И так меняю 10 инструментов. По малейшему чиху, чуть в ноту не попал. Также и ты.

Аноним 24/12/24 Втр 20:32:12 № 3349309 326

>>3349289
Так чё там искать, всего 100 вакансий на всю Россию. А там где требуют опыт от 1 года, я очкую откликаться. Мне нужен человечек изнутри, чтоб чётко описал рабочие процессы. Тогда может и удастся наебать систему. Хотя потом чекнут трудовую и ещё посадят за пиздёж.

Ладно. Уже праздники на носу, поздно думы думать. Буду пока линуксы и сети подучивать, чтоб расширить пул вакансий к февральской лавине. Хотя мне БД ближе по душе.

Вот кстати! А что если откликнуться к ним же, но через месяцок и накрутить нууу, скажем, 7-8 месяцев попыта? А чё, вроде уже и не такой пиздёжь получается, т.к. учусь как раз полгода. Ну да, не коммерческий опыт, но практический зато! Всё как они хотят блять.

Главное дойти до тех. собеса, чтоб блеснуть знаниями своими охуевшими. И зп демпить не буду, сразу напишу тыщ 80, чтоб они все там с обалдевшими лицами сидели!!

Аноним 24/12/24 Втр 20:46:02 № 3349323 327

>>3349309
Ой не пизди пожалуйста. Вакансий не 100, а 344. Сними нахуй все флажки. Сними флажок "без опыта". Сними флажок "стажировка". Удали из поиска все лишние приставки. Оставь только "dba". Вот так и ищи.

Если очкуешь откликаться - то не откликайся. Более борзый чел без задней мысли откликнется, получит твою работу, будет копить опыт, а ты будешь хуй сосать и стесняться дальше.

Требовать они будут на параше. Кто они блять такие, не наняли а уже требуют омегалол. Забудь это слово "требуют". Пока вы контракт не подписали - они просто какие-то левые люди с улицы. Они максимум могут высказывать пожелание.

Повторно откликаться? Да нахуй они нужны! Пошли их нахуй и всё. У них не такая высокая зарплата чтобы ходить унижаться. Если бы у них была 500 тысяч рублей в месяц, тогда это имело бы смысл. А 60к можно заработать курьером или бомбилой, взять шаху и начать бамбить! И не надо проходить никаких собеседований.

Аноним 24/12/24 Втр 21:19:46 № 3349336 328

>>3349251
Покажи резюме.

Аноним 25/12/24 Срд 09:14:17 № 3349484 329

>>3349251
DBA полумертвая тема. Или мертвая для вкатунов. На огромный проект дай бог требуется 1 DBA. Иногда такого нанимают просто на аутсорсе. Работа стрессовая, надо чинить базы при падении, восстанавливать всякое говно из бекапов. Пиздец конечно.

Аноним 25/12/24 Срд 19:54:11 № 3349930 330

Снимок экрана 2[...].jpg 138Кб, 1115x833

>>3348571
>>3268780 (OP)
Это нормально что в каждом графике такой пиздорез?
+ Этот перевод, в англ версии написано простым текстом просто и понятно, а тут нечеловеческим языком. + Гугл переводит так же по-человечески.

Кто блядь эти книги клепает

Аноним 25/12/24 Срд 20:10:26 № 3349932 331

Что лучше иметь одну таблицу с двадцатью колонками или допустим десять таблиц и просто связывать их по айдишнику?

Аноним 25/12/24 Срд 20:44:49 № 3349953 332

>>3349930
Читай тогда только на английском. Бугурт на пустом месте.

Аноним 25/12/24 Срд 21:20:19 № 3349980 333

>>3349932
Есть форматы хранения строковые, а есть колоночные.
Колоночный умеет читает отдельные колонки. С ним можно делать широкие таблицы.
Строковый читает по строкам. С ним, в прицнипе, тоже можно делать широкие таблицы, ведь сейчас не 1985 год. Но, возможно, ты захочешь использовать колоночный процессинг для такого.
В классичсеких РСУБД обычно принято делать нормализацию данных по модели и использовать join.
Что будет работать быстрее - я бы проверял на конкретных примерах.
Если данных мало - то "для себя" можешь делать как хочешь, а для кого-то - как "правильно".

Аноним 25/12/24 Срд 21:21:03 № 3349981 334

>>3349932
It depends. Если у тебя колонки VARBINARY(MAX) и разработчики дебилы с орм головного мозга, то лучше большие колонки вынести в отдельную таблицу, иначе база ляжет на SELECT * FROM table. Если это обычные колонки уровня дата рождения сумма начисления, тогда все в одну.

Аноним 25/12/24 Срд 21:22:39 № 3349982 335

>>3349932
Лучше делать так, чтобы было эффективнее.

Аноним 25/12/24 Срд 21:29:30 № 3349986 336

>>3349932
Ит депендс ёпт.

Если запросы в основном на чтение и схема меняется редко, можно все в одной таблице (меньше джойнов=быстрее чтение). Если схема часто меняется и много запросов на запись, лучше разделить, шоб минимизировать риск аномалий.

Аноним 25/12/24 Срд 21:33:07 № 3349987 337

>>3349986
>Если запросы в основном на чтение
Если он без индекса будет читать, разве не будет замедления от того, что будет читаться вся большая строка и потом из неё выбираться поле фильтрации?
А по хешу джойны с маленькими словарями быстро пройдут.

Опять же, в случае денормализованных данных надо обновлять все строки. Недостаточно просто в словаре поменять статус, например - надо во всей базе его обновлять вручную.

Аноним 25/12/24 Срд 21:33:47 № 3349988 338

>>3349986
>>3349980
>>3349981
Дополняю инфу. XML данных примерно 60 мб, импортируется один раз в год в лучшем случае, но запросы должны на вывод должны работать быстрыми. Никакого ОРМ нет и не будет. Поля текст UTF8 и числа.

Аноним 25/12/24 Срд 21:39:17 № 3349990 339

>>3349988
Раз у тебя данные редко загружаются, то красиво будет разложить данные по схеме, 3NF или звезда, а потом сделать по ним те же matview с нужными данными под чтение, можно ещё индексы на них накинуть для быстроты.

Аноним 25/12/24 Срд 21:40:55 № 3349992 340

>>3349990
Ни слова не понял. По моим вопросам же видно, что я ньюфаг делаю второй раз бд.

Аноним 25/12/24 Срд 21:43:09 № 3349994 341

>>3349992
60 МБ должны быстро читаться как угодно, если запросы будет писать не безумный человек.

Аноним 25/12/24 Срд 21:45:24 № 3349998 342

>>3349994
>если запросы будет писать не безумный человек
Ну SELECT FROM table where x=y это надеюсь не безумно?

Аноним 25/12/24 Срд 21:47:23 № 3349999 343

>>3349998
Нет.
Если поле x содержит уникальное значение то добавь индекс на него.

Аноним 26/12/24 Чтв 12:26:46 № 3350291 344

Анон, как правильно делать пагинацию при помощи курсоров без limin и offset? Я про это: https://habr.com/ru/companies/ruvds/articles/513766/

Что такой курсор в данном контексте? Это объект базы данных https://ru.wikipedia.org/wiki/%D0%9A%D1%83%D1%80%D1%81%D0%BE%D1%80_(%D0%B1%D0%B0%D0%B7%D1%8B_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85) или что-то другое?

Аноним 26/12/24 Чтв 12:31:27 № 3350293 345

>>3350291
И еще вопрос. В примере в статье все id целочисленные. А как быть, если в качестве id используется UUID?

Аноним 26/12/24 Чтв 13:36:42 № 3350325 346

>>3350291
Курсор просто означает что ты знаешь конкретную точку отсчета. Не OFFSET n, а конкретный идентификатор от котрого отсчитывать лимит.

>В примере в статье все id целочисленные. А как быть, если в качестве id используется UUID?
Использовать UUID седьмой версии, он же ULID.

Аноним 26/12/24 Чтв 20:19:49 № 3350582 347

>>3350325
нахуй использовать uuid вообще? serial не хватит всем?

Аноним 26/12/24 Чтв 21:36:07 № 3350612 348

>>3350293
Не используй UUID.

Аноним 26/12/24 Чтв 22:03:17 № 3350624 349

>>3350582
Ну во первых serial генерится базой. То есть чтобы присвоить идентификатор какой-то сущности в коде нужно сделать запрос в конкретную базу и дернуть конкретную последовательность.

А если эта база на другом сервере вообще? Создавать апи по выдаче идентифкаторов? Использовать временные идентификаторы? Причем идентифкатор нужен сразу, а сохранение данных в базу это вообще последний этап. Не факт что там вообще до сохранения в итоге дойдет.

Сквозной гарантированно уникальный идентификатор, который можно сгенерить вне зависмости от базы, в любой точке кода решает большинство вопросов. Его можно и как ключ идемпотентности использовать и на клиенте генерить. И вообще UUID это тоже число, только большое. Короче WIN-WIN. Serial поля для первичного ключа нахуй не нужны.

Аноним 27/12/24 Птн 05:19:09 № 3350706 350

>>3350624
Очень жирно. Хотя среди фулстек мартышек бывают и такие наглухо отбитые долбоебы.

Аноним 27/12/24 Птн 09:07:07 № 3350738 351

>>3350706
Нихуя жирного.
Если у тебя базенка на две таблицы, в которую пишут полтора человека в год, оно может и не очевидно что какие-то проблемы могут быть.
Но во всех более-менее крпных проектах, которые я видел рано или поздно внедряли UUID'ы.

Аноним 27/12/24 Птн 09:22:29 № 3350742 352

>>3350738
Ты вытекаешь из треда.

Аноним 30/12/24 Пнд 23:30:10 № 3353209 353

Пытаюсь создать кластер postgresql в дебиане. Делаю pg_createcluster -u postgres -g postgres -d db-dir -p 1234 17 new_cluster
Оно вроде создается, но папка db-dir пустая. Почему там нет кучи файлов конфигов?

Аноним 31/12/24 Втр 00:42:59 № 3353231 354

>>3353209
починилось. похоже я забыл постгрю остановить

Аноним 31/12/24 Втр 01:04:49 № 3353232 355

Может есть какая то книжка в которой бы был пример как настроить логическую репликацию для serialiazable trtansactions, чтобы они и синькались полностью? Я уже устал доку читать. Я понял, что нужно настроить реплику с sync on, но настраивать заебался.

Аноним 31/12/24 Втр 01:46:09 № 3353236 356

>>3353232
"PostgreSQL 15 изнутри" под редакцией Е. В. Рогова

Аноним 31/12/24 Втр 07:04:42 № 3353257 357

>>3268780 (OP)
Дайте советов мудрых как задрочить SQL, чтобы собесы на раз-два проходить и в работе не лажать? До этого только ковырял ноусиквель бдшки и работал со всякими редисами и прочими монгами

Аноним 01/01/25 Срд 16:34:32 № 3353990 358

>>3353236
я настроил по гайду индуса с ютуба. когда реплика жива все ок. я уронил реплику, попытался вставить значение в таблицу. вставка зависла, а при отмене вот такое соообщение
Cancel request sent
WARNING: canceling wait for synchronous replication due to user request
DETAIL: The transaction has already committed locally, but might not have been replicated to the standby.
COMMIT

И при select я вижу результат. Это не то что нужно. Оно не должно вставлять, если вторая нода не подтвердила получение. synchronous_commit установлен в remote_apply, так что я не понимаю почему он коммитит транзакции. Как фиксить?

Аноним 01/01/25 Срд 16:36:52 № 3353991 359

https://stackoverflow.com/questions/72953936/postgresql-streaming-replication-reject-insert

Пишут, что нельзя отменить? Чеее нахуй? А смысл тогда синхронных коммитов? Я специально это настраивал на случай, если диск навернется один, чтобы все на втором было.

Аноним 01/01/25 Срд 16:40:40 № 3353993 360

https://stackoverflow.com/questions/42686097/how-to-disable-uncommited-reads-in-postgres-synchronous-replication

Лол. Сколько я времени потратил на изучение репликации, чтобы в итоге узнать, что она не решает мою задачу. Ахуууй.

Аноним 01/01/25 Срд 19:46:11 № 3354104 361

На какую работу можно вкатиться умея только в SQL-запросы, ну максимум бэкапы/репликацию? Опыта в этой области не было, лишь айтишное образование и скромный опыт работы эникеем. Вакансий с гулькин хуй, непонятно чем там вообще люди занимаются. Вообще сомневаюсь, что это перспективная тема и что я не останусь у параши потратив время и силы на схуэль. Если есть кто опытный - просвятите, как вкатились, какие задачи решаете на работе и стоит ли овчинка выделки.

Аноним 01/01/25 Срд 19:51:04 № 3354111 362

>>3278398
>где люди так или иначе работают на жирных ноутах и модельки локально обучают
Ну я обучал модельку решать капчу, которая генерируется популярным классом для PHP. Но код тормознутый. Соответственно, я у себя на компе запускаю скрипт в PHP CLI в 8-16 процессов, они генерируют пачки, скажем по 1000 капч, потом это все складывается в SQLite, потому что из PHP удобно складывать в него и потому что база хоть и простецкая, но лок поддерживает, можно в нее складывать из нескольких процессов, если не по одной строчке, а пачками. Дальше я выгружаю этот файл SQLite на Google Drive, который монтирую из Colab'а, открываю из питона эту SQLite-базу и обучаю на колабе собственно модельку.
мимо шел, не шарю в ваших бдшках на самом деле

Аноним 01/01/25 Срд 22:31:20 № 3354187 363

>>3278398
>Если же надо большие данные - есть жирные реляционные БД
>жирные реляционные БД
СУууууука! Аж передёрнуло! Этот кадр вообще видел цены на бд в облаке? Всего-то минимум 5к рупь/месяц плотишь за самый дешманский кластер)))) Я представляю сколько будет стоить ЖИРНАЯ реляционка.

Аноним 01/01/25 Срд 23:54:36 № 3354205 364

>>3354187
>бд в облаке
А нахуй это надо? Это типа для тех что не в состоянии базу на обычном хостинге поднять? Налог на тупость?

Аноним 02/01/25 Чтв 04:48:11 № 3354256 365

>>3354104
В техподдержку наверное. Ну с айтишной вышкой можешь попробовать dba, думаю шансы высоки найти работу. Правда надо знать немного больше, чем ты написал. Ну ещё можешь в 1С вкатиться, т.к. 1С это по сути тупо sql, но на русском.

Аноним 02/01/25 Чтв 06:21:03 № 3354264 366

>>3354205
Видишь, сычушь, поднять базу через докер ран постгре:латыст это только начало. Ее еще нужно правильно скофигурить и обслуживать. Удачи поднять базюльку на виртуалке, которую тебе потом хэкнут скрипткидди

Аноним 02/01/25 Чтв 09:41:05 № 3354293 367

>>3354264
>Налог на тупость
Я так и написал.

Аноним 02/01/25 Чтв 13:06:33 № 3354350 368

>>3354205
>А нахуй это надо? Это типа для тех что не в состоянии базу на обычном хостинге поднять? Налог на тупость?
А хуле ты думал, все эти dynamodb, и решения типа sqlite на efs - это всё от хорошей жизни? Дохуя таких умных приходят, советы раздают - ну тип прост без задней мысли арендуешь жирную реляционную бд за 100к/месяц и не паришься))) Ого, я даже не знал что так можно! Обязательно воспользуюсь для моего хобби-проекта. Или есть же вот kurwa vps за $1,5 чё ты не пользуешься?))) Ага щаз блять, только перепишу миллион строчек кода и сразу уйду на kurwa vps. Посчитать даже допустим во сколько обойдётся решение на базе polars/dask/ray/duckdb и допустим редшифт или оракл, там цены начинаются от $0.5 в час. Это в районе $360/месяц или $4320/год. И это без учёта остальной инфраструктуры. Одно дело, что etl отработал и ты его удолил, а другое - когда бд всегда висит и с тебя каждый час бабки снимают.

Аноним 02/01/25 Чтв 13:44:37 № 3354369 369

>>3354350
>Нахуя арендовать ДБ?
>Дохуя таких умных приходят, советы раздают - ну тип прост без задней мысли арендуешь жирную реляционную бд за 100к/месяц и не паришься)))

Аноним 03/01/25 Птн 16:27:44 № 3355137 370

Эххх, щяс бы в девопс вкатиться.

Аноним 03/01/25 Птн 18:27:24 № 3355224 371

>>3355137
А базы данных здесь при том, что...

Аноним 04/01/25 Суб 01:24:38 № 3355397 372

Как SAP data services выучить? Первый раз с этим работаю. Могу трогать только на работе, но там уже все настроено, тысячи таблиц, jobs, процессов автоматических настроено и вообще много всего. Курсы какие-то вижу только за тысячи долларов, а на работе приходится что-то там делать, страшно что-то случайно удалить или не то загрузить. В принципе немного потыкаясь понимаю базовый функционал, хочется что-то поглубже, но боюсь учиться на готовой архитектуре уже в продакшене.

Аноним 04/01/25 Суб 05:11:01 № 3355449 373

>>3355224
При том, что в современном мире админят бд именно девопсы. Девопс это три в одном — разраб, админ бд + админ сервера. Ну ещё иногда выполняет роль надсмотрщика, а ещё иногда бывает занимается не только настройкой мониторинга, но и сам мониторит, потому что работодатель решил сэкономить на инженере мониторинга.

Поэтому девопсы получают сильно выше зп. Так ведь я ещё забыл, что девопсы часто бывают on-call по кд. Поэтому я думаю, что им даже мало платят, должны х2 как минимум платить. То есть грейд синьора должен начинаться от 1кк/мес как минимум!!

Аноним 04/01/25 Суб 05:18:26 № 3355450 374

>>3355449
Разводи эту шизу в девопс-треде, а сей тред оставь пенсионерам-ДБА, никогда не видившим YAML.

Аноним 04/01/25 Суб 12:08:50 № 3355545 375

>>3355450
Ну пенсионерам придётся подстраиваться под рынок IaaS и переквалифицироваться в DBAaaS. Ещё 2-3 года и усё, пиши прощай, без работы останутся, хех. Я не со зла ведь говорю, а наоборот, дружелюбно предупреждаю.

Это все равно что быть фронтендером из 2005 и фронтендером из 2025 — две большие разницы.

Аноним 04/01/25 Суб 12:31:56 № 3355560 376

>>3355545
Хуй с яишенкой сравнил. Это две разные профессии. Девопсины вообще кроме ямлов и сетей нихуя не знают. То что сасы услуги бд предоставляют не делает двопсов автоматически дба. Про разделение труда слышал?

Аноним 04/01/25 Суб 13:36:55 № 3355580 377

>>3355560
Только вот кабану выгоднее нанять тиму девопсов и бОльшую часть задач по DBA спихнуть на облачного провайдера, чем нанимать и 2 тимы: девопсов и дба. Поэтому рано или поздно на всю страну останется 3-4 банка и госухи (зп на уровне кассира, так что даже не рассматриваем как работу), где будут тимы дба отдельные и усё.

Кароче неча тухнуть в своём болоте доисторическом. Надо двигаться вперёд. Ну или побыстрее нафармить себе на хаты и стать рантье!))

Аноним 04/01/25 Суб 13:41:08 № 3355581 378

>>3355580
Ну если кабан долбаеб и считает что это выгоднее, то это его личные проблемы. Пусть еще к проктологу+стоматологу сходит, чтобы жопу и зубы у одного врача полечить. Выгодно же!

Аноним 04/01/25 Суб 13:53:01 № 3355586 379

>>3355449
>>3355545
>ASS
Справедливо если у тебя базенка с 5 таблами и пишутся туда 2-3к строчек в день. Высоко нагруженный OLTP уже нужно чисто постгрес или другую хуйню тонко настраивать.

А уж про OLAP базы я не говорю. Тот же ванильный гринплам иди подними не в ДЦ, а в облаке. Ага, хуйца соснешь. Так ещё собрать его нужно из исходников и настроить нужно так чтобы не падал.

Аноним 04/01/25 Суб 18:58:44 № 3355729 380

Анон какой клиент юзаешь?Раньше ставил всегда пхпмаиадмин,тут понял что заебался его постоянно ставить,пердолится с конфигом и конфигом сервера еще.Решил поставить альтернативу и что-то нету ничего годного.ГПТ спросил - хуергу мне насоветовал.Вот смотри скрин.Это лютый пиздец.Кто то кроме меня это запускал?Кажется что даже разраб это не запускает.Сука блядь,антон посмотри на третью строку меню.Блядь,белый шрифт на белом фоне,блядь серый шрифт на сером фоне.Это пиздец.Не нашел как поменять этот всратый внешний вид.Кароче есть че а?

Аноним 04/01/25 Суб 19:09:14 № 3355732 381

>>3355729
отклеилсо

Аноним 04/01/25 Суб 19:15:08 № 3355736 382

>>3355729
DBeaver и изредка Oracle SQL Developer

Аноним 04/01/25 Суб 19:42:27 № 3355748 383

>>3355736
>DBeaver
А интерфейс такойж как на пике?Или ты как то поменял?
Так то вроде не плохое ПО,все быстро встало и завелось без проблемом.Но шкура у него ,просто иди нахуй сказала.

Аноним 04/01/25 Суб 19:52:23 № 3355751 384

>>3355748
Ничего не менял, интерфейс выглядит нормально, как скрины из гугла. Тут дело то ли в теме, то ли в шрифтах, хз.

Аноним 04/01/25 Суб 21:05:43 № 3355768 385

>>3355751
Хм,позже тогда попробую настроить.Спасибо анон.

Аноним 05/01/25 Вск 20:51:22 № 3356233 386

Здравствуйте, я хочу вкатиться в фуллстеки Laravel php + vueJS и nuxtJS

Моя задача сейчас учить sql

Подскажите, пожалуйста, в sql роадмапе sqlдо какого пункта мне дрочить матчасть по sql:

ссылка на роадмап
https://roadmap.sh/sql

Прошлый раз я задавал этот вопрос очень давно, я где-то на почте себе пост сохранил и найти теперь не могу. Кажется, если память не изменяет аноны сказали дрочировать до пункта Data Integrity and Security

Как считаете до этого пункта Data Integrity and Security нормально будет?

Мне как нубу не понадабятся на начальном этапе хранимые процедуры и функции?

Аноним 05/01/25 Вск 21:12:08 № 3356244 387

>>3356233
Пиздец. Ты до инфаркта доведешь такими вопросами.

ПИШИ КОД БЛЯДЬ
И
Ш
И

К
О
Д

Б
Л
Я
Д
Ь

Аноним 05/01/25 Вск 21:22:41 № 3356250 388

>>3356244
Я так и знал, что ответа не будет. Всё. Ладно. Буду дрочироваться до пункта Data Integrity and Security. Кажется прошлый раз до этого пункта на двоще сказали. Я просто сохранил текст того поста с ответом, да найти не могу нигде.

Аноним 05/01/25 Вск 21:28:08 № 3356253 389

>>3356250
Твой вопрос имел бы смысл если бы ты к сертификату готовился, а после получения сертификата тебе было бы похуй что останется в голове. Твоя же задача понимать что ты делаешь когда решаешь задачу, понимать как сделать задачу, как ее декомпозировать на мелкие задачи.

Поэтому тебе надо начать писать код. У тебя не получится. Надо гуглить и снова и дальше писать. Надо постоянно держать в голове решаемую задачу. А не список вопросов которые ты "должен" зазубрить/

Аноним 05/01/25 Вск 21:35:22 № 3356259 390

>>3356253
Ладно, извините, пожалуйста, просто у меня очко горит, хочу быстрее вкатиться, я ж с 2к16 года начал учить штмл цсс жс вебпук и до сих пор не вкатился. Вот я и подгораю неистово, полыхает у меня. Извините, пожалуйста.

Аноним 06/01/25 Пнд 02:54:07 № 3356378 391

Читаю как работать с JDBC. В доке написано, что если я делал запросы внутри транзакции и у меня вылетело исключение, то мне обязательно нужно сделать явно rollback, потому что иначе не понятно какие изменения были закоммичены. Вопрос - какого хуя? Разве не смысл транзакции в том, что пока я не вызвал коммит, ничего не закомичено? Пока это выглядит так, будто если у меня программа упала во время выполнения транзакции, то дб останется в поломанном состоянии. Или как это работает?

Аноним 06/01/25 Пнд 03:44:09 № 3356382 392

>>3356378
Конечно же, ничего само не закоммитится, если явно не закоммитить (ну или неявно через какую-нибудь спринговую прослойку). Вероятно, там имелось в виду, что надо внимательнее обрабатывать ошибки, вдруг у тебя в методе делается 10 апдейтов, на восьмом апдейте свалилось, но эксепшен по какой-то логике проигнорировался, и часть выполненных апдейтов закоммитится, приводя данные в несогласованное состояние.

Аноним 06/01/25 Пнд 03:53:28 № 3356383 393

>>3356382
Тогда звучит логично. Вот откуда я это взял
https://docs.oracle.com/javase/tutorial/jdbc/basics/transactions.html

When to Call Method rollback

As mentioned earlier, calling the method rollback terminates a transaction and returns any values that were modified to their previous values. If you are trying to execute one or more statements in a transaction and get a SQLException, call the method rollback to end the transaction and start the transaction all over again. That is the only way to know what has been committed and what has not been committed. Catching a SQLException tells you that something is wrong, but it does not tell you what was or was not committed. Because you cannot count on the fact that nothing was committed, calling the method rollback is the only way to be certain.

The method CoffeesTable.updateCoffeeSales demonstrates a transaction and includes a catch block that invokes the method rollback. If the application continues and uses the results of the transaction, this call to the rollback method in the catch block prevents the use of possibly incorrect data.

Почему то на SO не нашел моего вопроса

Аноним 06/01/25 Пнд 11:15:22 № 3356475 394

>>3356259
Тебе нужны таблетки от рефлексии, сходи к психотерапевту. Мне помог тритико, я перестал анализировать и рассуждать "а надо ли?" или "другой стек выглядит интереснее... попробовать ли?". Ну и в целом стал немного овощем, что меня на самом деле спасло.

Но кому-то он и не помогал, а только хуже делал. Как повезёт.

Аноним 06/01/25 Пнд 11:58:28 № 3356498 395

>>3356259
>я ж с 2к16 года начал учить штмл цсс жс вебпук и до сих пор не вкатился
Когда пишешь реальные сука проекты, с реальными задачами, то учишь только то что нужно здесь и сейчас. А когда ставятся абстрактные цели, то и вкатываются по 10 лет. Давай сегодня криптографию выучим? А, ну давай. Давай сети выучим? Давай. В итоге, учишь учишь учишь учишь, а выхлопа нет никакого. В айти нет недостатка информации, можно бесконечно вариться в каких-то гайдах, книгах, курсах. Но в итоге, у тебя нет ни портфолио, ни проектов.

Аноним 06/01/25 Пнд 14:15:32 № 3356562 396

>>3354205
> поднять базу
> поднять зукипер
> поднять забикс
> настроить алерты
> настроить бэкапы
> периодически докидывать ноды и ставить обновления
> нанять девопса который будет этим заниматься и автоматизировать
Если тебе хватает базы в докере, это всё конечно нерелевантно.

Аноним 06/01/25 Пнд 17:00:17 № 3356765 397

>>3356562
А где это все настроено? Че-то есть большие сомнения что за пять косарей, тебе дадут ручного клоуна, который тебе под постгрю зукипер поднимать будет.

Не убедительно, по прежнему звучит ка кналог на тупость.

Аноним 06/01/25 Пнд 19:25:15 № 3356858 398

Почему игнорируете >>3355397 ? В неправильном треде вопрос, а где тогда спросить?

Аноним 06/01/25 Пнд 19:47:13 № 3356886 399

>>3356858
Никто здесь с ним не работал, очевидно же. Скорее всего, тебе придётся разбираться самому.

Аноним 06/01/25 Пнд 20:41:45 № 3356907 400

>>3356886
Понятно, постараюсь потихоньку разобраться. Странно, что никто не работал, мне казалось это очень популярный сервис.

Аноним 07/01/25 Втр 17:10:13 № 3357372 401

Добрый день уважаемые форумчане.
У меня такой вопрос.
Вот читаю я про устройство/различия между Postgres и MySQL.
Пишут что раньше (сейчас якобы эта граница фактически нивелирована)
Pgs "в основном" применялась для аналитики данных, а MySQL для онлайн транзакций.
На чем это основано и в чем принципиальная разница между этими двумя сферами применения?
Какие особенности внутреннего устройства/дизайна способствуют этому?(Процессы vs потоки, индексы и т.д.)

Аноним 07/01/25 Втр 21:00:10 № 3357649 402

>>3357372
в пг таблицы - heap, как раз транзакционные
для аналитики есть распределённая гринплюм на основе пг

Аноним 08/01/25 Срд 13:21:12 № 3357757 403

>>3357372
>MySQL
Эт че?

Аноним 08/01/25 Срд 17:57:50 № 3357961 404

>>3357649
>в пг таблицы - heap, как раз транзакционные
можно по подробней

Аноним 08/01/25 Срд 23:36:11 № 3358165 405

>>3357961
Heap-таблицы становятся транзакционными благодаря архитектуре PostgreSQL, которая:
— Реализует транзакции через MVCC, сохраняя несколько версий строк.
— Использует WAL для обеспечения долговечности и восстановления.
— Гарантирует атомарность, согласованность, изоляцию и долговечность (ACID) операций над таблицами.

Аноним 09/01/25 Чтв 00:37:54 № 3358185 406

Подскажите +- актуальный роадмап с нуля в текущих условиях рф? В смысле DE и околосмежных тем с dwh.

Аноним 09/01/25 Чтв 17:59:56 № 3358737 407

Насколько пикрил книга мастхев?

Аноним 09/01/25 Чтв 18:19:50 № 3358755 408

>>3358737
Одна книга ничего не решает. Даже написанная маэстро. Даже если толстая. Даже если это "всеми признанная классика". Это всё равно одна книга. Чтобы нормально вникнуть в тему, нужно хотя бы книг десять.

Аноним 09/01/25 Чтв 18:42:51 № 3358773 409

>>3358185
Ну хоть примерно накидайте...

Аноним 09/01/25 Чтв 19:01:42 № 3358784 410

>>3358185
У Жени Виндюкова смотри.

Аноним 09/01/25 Чтв 19:27:06 № 3358794 411

>>3358784
Женек, ты?

Аноним 09/01/25 Чтв 20:16:23 № 3358831 412

>>3358755
Я перед трудоустройством в 2013 г. прочитал 7 книг по теме, плюс не полностью ещё около 10 (вычитывал только нужные темы). Оглядываясь назад, могу сказать, что сделал всё правильно. Работы на тот момент было не так много. Если бы я проебал возможность, то я бы проебал возможность на очень долгое время, а может и навсегда.

Так что советую минимум 5-7 книг прочитать, иначе тебя жестоко попустят высокоуважаемые коллеги.

Аноним 10/01/25 Птн 02:47:34 № 3358928 413

Приветствую вас Уважаемые Форумчане.
Подскажите как лучше реализовать следующий функционал: необходимо выдавать текстовый документ по поисковому запросу.
В базу надо загрузить много файлов txt, проиндексировать каждый из них, ну и хранить и выдавать по запросу.
Вопрос такой, как хранить сами файлы?
1)OID (я так понимаю это просто ссылки на BLOB), выглядит симпатично. Смущает скудная инфа по тематике в интернетах, что наводит на мысль, что редко применяется.
2)BLOB не вижу разницы разницы с первым вариантом, только лишняя еботня с конвертацией их text --> bytea.
3)ссылки на файл. Пугает ибо кажется будут проблемы с репликацией.
Или может я изначально не правильный подход выбрал, тогда как лучше сделать?

Аноним 10/01/25 Птн 03:11:48 № 3358929 414

>>3358928
Поставь эластик и не еби людям мозги.

Аноним 10/01/25 Птн 03:43:14 № 3358935 415

>>3358929
понял

Аноним 10/01/25 Птн 08:20:21 № 3358989 416

>>3358929
Сейчас бы файлы раздавать эластиком. Он вообще не для этого, а для полнотекстового поиска, додь..

>>3358928
Складываешь ссылки на файлы в васянку, сами файлы на СХД, отдаешь энжинксом. Все!

Аноним 10/01/25 Птн 09:40:32 № 3359037 417

TameRequiredJae[...].mp4 292Кб, 576x304, 00:00:08

>>3358989
>по поисковому запросу
>проиндексировать каждый из них
>Он вообще не для этого, а для полнотекстового поиска

Аноним 10/01/25 Птн 21:30:28 № 3359532 418

>>3268780 (OP)
А где ньюфажные вопросы задавать? Ну типа на сколько таблиц дробить запись, чтобы не было повторяющихся полей? Про структуру базы? Как не наступить себе на хуй, если потребуется добавить полей?

Аноним 10/01/25 Птн 22:49:29 № 3359554 419

>>3359532
> типа на сколько таблиц дробить запись, чтобы не было повторяющихся полей
Ну это по идее в любой книге по БД объясняется, 1 нормальная форма, 2, 3 соотвественно (https://ru.wikipedia.org/wiki/%D0%A2%D1%80%D0%B5%D1%82%D1%8C%D1%8F_%D0%BD%D0%BE%D1%80%D0%BC%D0%B0%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F_%D1%84%D0%BE%D1%80%D0%BC%D0%B0)

Аноним 10/01/25 Птн 23:20:30 № 3359573 420

image.png 277Кб, 1149x3988

>>3359532
> где
Даже чатгпт сразу начал с нормальных форм.

Аноним 11/01/25 Суб 06:18:46 № 3359663 421

>>3358737
Ни насколько, чел. Это вообще не про базы данных. Это такой сборник шизовысеров "по мотивам" и "записки на передовой". Да и в целом книги нужно прорабатывать с составлением конспектов и разбором всех примеров на практике, а не просто читать как художку

Аноним 11/01/25 Суб 10:31:30 № 3359737 422

>>3358737
Кабанчик? Это обзорный справочник. Можно полистать, чтобы иметь общее представление по теме. Чем редис отличается от эластика, вот это все.

Аноним 11/01/25 Суб 12:51:39 № 3359798 423

>>3359573
EAV это галимая хуета. Он разваливается как только начинаются нагрузки выше, чем у личного бложика Васи из Самары.

Аноним 11/01/25 Суб 14:40:34 № 3359891 424

>>3359798
А этот EAV он с тобой в одной комнате? Ты его видел вообще?

Аноним 11/01/25 Суб 14:44:49 № 3359895 425

>>3359798
Для MVP сойдёт. Как альтернатива JSON/JSONB в постгре.

А для более сложных проектов можно юзать гибрид, когда основные данные хранятся в нормализованных таблицах, а дополнительные (временные, логи) или редко используемые данные хранят в полях типа JSONB. Или вообще в NoSQL базах.

Аноним 11/01/25 Суб 15:05:50 № 3359922 426

>>3359891
К большому сожалению видел. Я работал на проекте где на eav была построена вся система. Система обслуживала крупные госики и нагрузки соответствующие. Меня заебало делать кеш на каждый чих и я свалил оттуда.

>>3359895
Сам себе может и не плох в качестве доп. инфы, но делать делать точно не стоит, как описал выше. Нейронка не предупредила о рисках. За это большой минус.

Аноним 11/01/25 Суб 15:19:22 № 3359931 427

>>3359922
Лел, так EAV по определению работает быстрее, чем нормализованная база. Нормализация как раз за счет гарантий консистентности жертвует производительностью.
Сдается что ты либо пиздишь, либо это был не EAV.

Аноним 11/01/25 Суб 15:32:09 № 3359934 428

>>3359931
За каким хуем еав будет работать быстрее первой нормальной формы? Когда еав все запросы долбятся в одну и ту же таблицу.

Аноним 11/01/25 Суб 17:19:28 № 3360008 429

>>3358989
>васянку
что такое васянка?

Аноним 11/01/25 Суб 17:28:02 № 3360011 430

>>3359532
я сам ньюфаг если что
делаю так:
- гуглю схемы БД по нужной мне схеме, хуярю код (ORM | Sql)
- паралльельно читаю/изучаю теорию (по необходимости)

читать по этой теме (нормализация, оптимизация и т.д.) не практикуясь, так себе затея..

Аноним 11/01/25 Суб 17:28:28 № 3360012 431

>>3359934
Бля, я секунд десять пытался понять что за хуйню я прочитал. От формулировки, до содержания.
Зачем еав будет работать быстрее? Зачем? Его блядь че уговаривать надо?
Первая нормальная форма? Она ведь про множественные значения. Еав это третья форма, он соответтвует первой и второй.
Долбятся в одну и ту же таблицу? Это че дверь какая-то, в неё долбиться?

А потом я понял что это просто бессмысленный набор слов и со мной произошел пикрелейтед.

Аноним 13/01/25 Пнд 09:26:42 № 3360775 432

что нужно, чтобы вкатиться джуном в DE?
по убыванию:
1. sql
2. airflow
3. hadoop
4. python
5. greenplum
всё так?

Аноним 13/01/25 Пнд 10:50:11 № 3360848 433

>>3360775
> по убыванию:
1. sql/python
2. airflow/bash/linux
3. hadoop/greenplum
4. cicd/kuber/docker/spark

Вот так скорее. Чисто стек в нашем черно-жёлтом банке. Для Джуна даже дохуя. Пункт 4 для сеньки/джуна.

Аноним 13/01/25 Пнд 10:56:19 № 3360861 434

Раз уж упомянули гринплам, как правильно в нем с партициями работать?

Вот есть табличка с партициями по дате, я если новую хочу добавить, я должен ADD PARTITION ебануть на эту дату, а потом заливать инсертом данные в мастер-таблицу и оно сам там расплывется или как?

Аноним 13/01/25 Пнд 11:17:10 № 3360884 435

>>3360848
благодарю!

Аноним 13/01/25 Пнд 12:43:43 № 3360972 436

>>3360848
>*для сеньки/мидла
Быстрофикс.

>>3360884
Для джуна вообще хватит уверенного sql/python и знание что такое execution_date в airflow 2.

>>3360861
PARTITION RANGE нет в GP. Поэтому да, сначала добавляешь нужную партицию alter table ... add partition и потом инсерт данных. Возможно у самых новых проприетарных GP есть нормальная работа с партициями. Мы сидим на GP который основан на PostgreSQL 9.6 там все через жопу с партицированием.

Аноним 13/01/25 Пнд 13:03:52 № 3360991 437

>>3360972
>PARTITION RANGE нет в GP. Поэтому да, сначала добавляешь нужную партицию alter table ... add partition и потом инсерт данных
Понял, благодарю за ответ.

Аноним 13/01/25 Пнд 14:56:02 № 3361157 438

>>3360848
А КАК ЖЕ МАТЕМАТИКА!?

Аноним 13/01/25 Пнд 15:06:23 № 3361170 439

>>3360972
>Для джуна вообще хватит уверенного sql/python и знание что такое execution_date в airflow 2.
ну у вас в жёлто-чёрном явно не так, у вас ДРОЧЕВО ояебу и 100-этапные собесы наверное
мимо магистр 1 курс в поисках работы

Аноним 13/01/25 Пнд 15:06:34 № 3361171 440

>>3361157
Лол, вообще я по образованию математик Прикладная Математика и Информатика. Самая ложная математика в DE это расчет времени выполнения запросов в плане запроса. То есть умножение и сложение цифр.

Аноним 13/01/25 Пнд 15:08:01 № 3361172 441

>>3361170
А мы и джунов то не берём. Как то год назад один джун был нужен, помню у него спрашивали только за sql + python. Сейчас берём только мидлов/сеньеров.

Аноним 13/01/25 Пнд 15:10:38 № 3361175 442

>>3361172
сейчас везде вроде так, лол
ну новый год прошёл, надеюсь на открытие новых вакансий

Аноним 13/01/25 Пнд 15:22:51 № 3361186 443

>>3361172
расскажи хоть заодно, чем пользуешься - plpythonu или стандартный pl/sql и как часть приходится писать пользовательские функции?

Аноним 13/01/25 Пнд 16:14:15 № 3361265 444

>>3361175
Да хз, руководству нужны уже боевые единицы. Нет времени на раскачку обучение джунов.

>>3361186
Конечно же plpgsql. plpython в GP исполняется только на мастер-ноде. Эту ноду очень легко перегрузить в хранилище. Станет узким местом. А вот plpgsql умеет в сегменты. По крайней мере нам так сказал DBA, я не проверял. Да и нахуй не надо.

Аноним 13/01/25 Пнд 16:48:02 № 3361313 445

>>3361265
>сказал DBA
а не он, случайно, должен udf то и писать? часто приходится?
а то в питон могу, в пгскл пока что не сильно

Аноним 13/01/25 Пнд 17:47:44 № 3361348 446

>>3361313
Ну dba пишут свои процедуры. А мы de - свои. Вот недавно писал для аналитиков процедуру которая 2 таблы сравнивает и выдает подробный результат какие столбцы разошлись.

>пока не сильно
Думаешь я сильно? Так по примерам из тырнета пишу, чатгпт иногда привлекаю. Все таки мое основное это петухон. Да и я сеньер, у меня уже задачи где кода меньше. Сходить, узнать, сделать задачу другому отделу, собрать требования, согласовать и т.п. Хиккой не получится быть, надо ебашить в социоблядство.

Аноним 13/01/25 Пнд 21:06:52 № 3361499 447

Не могу людям односложно ответить на вопрос, "кем работаешь?"
У меня новая работа, тут занимаюсь налаживанием процессов ETL, автоматизация, разбираю бэкенд в SAP BODS, AWS, клауд миграция, SQL Management Studio, смотрю на кубы в Visual Studio еще делаю дашборды и аппликации в PowerBI и отчеты в Visual Studio.
Как бы вы это назвали? DE? DB Administrator? На что больше похоже?

Аноним 13/01/25 Пнд 21:10:24 № 3361504 448

>>3361499
Вообще первая работа в этой сфере. Хотелось после маги быть модным дата саентистом, а получилось, что получилось.
В итоге мне даже по кайфу

Аноним 13/01/25 Пнд 21:15:09 № 3361505 449

>>3361499
Скажешь DE - не обманешь. Или говори, что ты датаопс, лол

Аноним 13/01/25 Пнд 21:19:53 № 3361509 450

>>3361505
О, и правда похоже!

Аноним 13/01/25 Пнд 22:35:45 № 3361543 451

>>3361499
DE. Либо менее употребляемое DBD Database Develop.

Кстати, года так до 2017 в этой стране точно не было определения всеми этому. Кто как называл. Report Developer, OLTP/ETL Developer, SQL Developer. Все это объеденило Data Engineering.

Аноним 14/01/25 Втр 18:09:57 № 3362173 452

Приветствую вас Уважаемые Форумчане!
Вижу, что крупные компании часто используют OracleDb.
В чем преимущество этой базы данных для по сравнению, например, с Ps/MySQL?
- Развитый процедурный язык PL/SQL
- В целом Oracle более надежная, отлаженная и т.д.
- что то другое?

Аноним 14/01/25 Втр 18:16:44 № 3362183 453

>>3362173
Хинты есть которые действительно работают, поддержка от оракла и куча коробок завязана на Oracle DB. Плюс возможности для DBA для той же трассировки.

Ну и раньше до гойды были возможности купить коробку на PowerPC с процессором IBM и операционкой AIX. С уже установленным ораклом. Там на 1 ядро можно было делать дохуялион потоков. Таким образом интелы сосали со своим гипертрейдингом. Оракл мог любой говнозапрос обработать.

Аноним 14/01/25 Втр 18:29:38 № 3362195 454

>>3360848
>bash
узаю bash на регулярной основе, но я совершенно из другой сферы
для чего конкретно DE применяю bash?

Аноним 14/01/25 Втр 18:46:07 № 3362203 455

>>3362183
> Там на 1 ядро можно было делать дохуялион потоков.
как распараллелить бд (прием запросов) на множество потоков?
или этим сам Oracle+AIX занимается?
к примеру у меня открыт порт. На него хуячат запросы.
БД создает поток(MySql/Oracle) или процесс(в Postgres) для каждого запроса? или требуется дополнительное ПО?
вы тут пишите про всякие airflow/hadhoop и прочее, это для этого и требуется?

Аноним 14/01/25 Втр 19:05:29 № 3362225 456

В википедии написано:
"Для упрощения тестирования, независимости бизнес-логики приложений от СУБД существует подход, в котором СУБД выступает лишь в роли хранилища, с минимальным количеством хранимых процедур или полном отказе от них".
Какая в целом тенденция сейчас?
Бизнес-логика описывается на уровне back-end приложения на (python, C#, Go) или основной функционал стараются перенести на обработку самой Бд?

Аноним 14/01/25 Втр 19:23:11 № 3362233 457

>>3362225
Смари, братиш ёп, сейчас типа в тренде больше вхуяривать бизнес-логику на уровне бэкенда, а базы юзают просто как тупое хранилище данных — так проще масштабировать и поддерживать приложение. Но если у тебя, допустим, хайлоад или нужно жёстко оптимизировать производительность, то логично часть функций перенести в БД: в хранимые процедуры, триггеры и.. короче, всё, что можно выполнить быстрее прямо на стороне СУБД. Такой гибридный подход тоже норм заходит, особенно если данных дофига и их надо агрегировать. Но чисто для общей тенденции — кодить логику на питоне, го, шарпе и т.д. сейчас типа стандарт. Ты, главное, юзай этот подход с головой, а хранимые процедуры оставляй для реально нужных штук, а не ради флекса, понял?

А при чём тут микросервисы? Да при том, что в этой архитектуре каждый сервис отвечает только за одну фичу и может юзать вообще любую базу, хоть PostgreSQL, хоть Mongo, хоть что угодно. Поэтому всю логику фигачат в бэкенд, чтобы сервисы были независимые и могли спокойно масштабироваться. Если бы логику вхуячили в базу, то пришлось бы тащить за каждым сервисом конкретную СУБД, а это ёп костыли и проблемы с поддержкой. Короче, для микросервисов тупая база(когда база используется только для хранения данных, а вся логика обработки и проверки лежит на приложении, без хранимых процедур, триггеров и всяких сложных SQL-фишек) — это вообще мастхэв, а вот в монолите гибридный подход ещё живёт и даже иногда превалирует.

Аноним 14/01/25 Втр 20:40:12 № 3362289 458

>>3362233
что думаешь, микросервисы - будущее? или хуйня для усложнения/ухудшения?
вроде и с монолитом хорошо живётся, нет?

Аноним 14/01/25 Втр 20:52:58 № 3362295 459

>>3362195
Пердолинг в ssh. Вот буквально сегодня делал rm -rf по определённым файлам с определенной датой создания. Ибо их там дохуя накопилось и админы начали на меня наезжать.

Неделю назад выяснял какие права нужны в линухе, чтобы этот файл можно было удалить, файл создан другим пользователем. Вот кстати, давайте без гугла ответьте, проверьте себя.

Как-то вот вызывал api через bash внутри ci/cd. Навалял небольшой скрипт.

Ещё встречал абсолютно мудацкие интеграции, когда система коннектится по ssh и кладет файл с отчетом. Ебаное Легаси, надо было писать генерацию таких файлов.

>>3362203
Сама по себе лютая БД работает не в однопотоке. Особенно если запрос из 20 джойнов. В каждую таблицу надо сходить, статистику по каждой табле получить, построить план запроса и только потом выполнять сам запрос. В тех же ораклах как то развлекался вставляя хинт +parallel(4) и замерял насолуьо лучше или хуже стало.

Airflow это оркестратор вообще, посредственное отношение к БД имеет. По сути это очень мощный визуальный cron. Hadoop просто один из видов хранилища.

Аноним 14/01/25 Втр 21:33:20 № 3362315 460

>>3362289
>что думаешь, микросервисы - будущее? или хуйня для усложнения/ухудшения?
Микросервисы - это настоящее. БУДУЩЕЕ за НАНОсервисами и ИИ. Деплоится будет не сервис, а одна-единственная функция которая может допустим читать из БД, но не может ничего писать. Это всё будет общаться по шине сообщений, гибко фильтроваться и деплоиться кодом.

Аноним 15/01/25 Срд 01:46:32 № 3362425 461

>>3362289
Эта хуйня для попильных стартапов, которые никогда не выйдут в прод. Микросервисы позволяют нанимать литерали любых васянов с любым стеком, а не собирать команду полгода. Когда микросервисы попадают на прод, начинаются дичайшие боль и страдания. Посмотри выступления челов с Авито, они сожрали ебаный океан говна.

Аноним 15/01/25 Срд 02:02:14 № 3362431 462

>>3362225
Современная тенденция писать логику на бэке, так проще отлаживать. Хранимки сейчас - это просто sql, написанный в одном месте, а не размазанный тонким слоем Queryable говна по всему коду. Ты открываешь код хранимки и сразу видишь всю логику. Триггерами не пользуются, а то охуеешь собирать этот пазл.

Аноним 15/01/25 Срд 04:01:36 № 3362447 463

>>3362425
амазон работает на микросервисах

Аноним 15/01/25 Срд 11:37:37 № 3362659 464

>>3362447
Амазон огромный, там дохуища всего. Магазин и AWS работают на обычных классических серверах с конкаренси, никто не будет переписывать такие титанические проекты под очередной модный пук.

Аноним 15/01/25 Срд 12:48:14 № 3362725 465

Sqlite - это база.

Аноним 15/01/25 Срд 13:49:47 № 3362778 466

>>3362725
Жаль, что в ней нет хранимок.

Аноним 15/01/25 Срд 17:57:42 № 3363017 467

>>3362233
>>3362233
>>3362233
>>3362295
>Неделю назад выяснял какие права нужны в линухе, чтобы этот >файл можно было удалить, файл создан другим пользователем. >Вот кстати, давайте без гугла ответьте, проверьте себя.

сам юзер владелец или администратор, разве нет?

Аноним 15/01/25 Срд 18:03:25 № 3363027 468

>>3362295
а так ты про командную оболочку, я думал про язык bash
я вместо питухона везде bash юзую
для абсолютно любой задачи (даже самой изощренной) можно скрипт написать. да синтаксис с ебанцой, но функционал ебейший зато

Аноним 15/01/25 Срд 18:12:14 № 3363038 469

>>3363017
Ответ неправильный. Пробуй ещё. Вопрос с подвохом.

>>3363027
Ну скорее да, больше про пердолинг в консоли.

Аноним 16/01/25 Чтв 11:49:13 № 3363514 470

Нужно отрисовать модель имеющейся БД в MySQL Workbench. Есть тип данных в качестве идентификатора uuid. В воркбенче его нет. Как лучше обозвать тип uuid?

Аноним 16/01/25 Чтв 14:17:19 № 3363673 471

>>3363514
>MySQL
Эт че?

Аноним 16/01/25 Чтв 14:25:29 № 3363677 472

>>3363673
MySQL — свободная реляционная система управления базами данных

Аноним 16/01/25 Чтв 18:39:39 № 3363949 473

>>3363038
>Ответ неправильный. Пробуй ещё. Вопрос с подвохом.
достаточно только того, чтобы был доступ к директории где находится файл?

Аноним 16/01/25 Чтв 18:46:49 № 3363961 474

>>3363949
Да, почти. Нужен доступ к директории на запись. К самому файлу у тебя может и не быть доступа, но удалить ты его сможешь.

Аноним 16/01/25 Чтв 19:00:08 № 3363983 475

вообщем в последнее время я фулстек-инженер-сделай-то-то.
опишу задачу и сразу же как я планирую ее реализовать.
Есть Ps-бд, в нее переодически добавляются данные.
При добавлении записи напишу триггер, который в случае если (пользователь/время/и т.д.) удовлетворяют условию
--> данные заносятся в отдельную таблицу-логов.
Затем эти логи в удобоваримом виде нужно захуячить в файл (txt сойдет), чтобы кабанчик в любое время мог их глянуть.
Загвоздка(для меня) как логи перенести в файл...
Я могу через триггер сразу и в базу и в файл писать?
Сам я планирую написать bash/cron скрипт который раз в час будет эти данные из базы вынимать и писать в файл.
Так сойдет для сельской местности?

Аноним 16/01/25 Чтв 19:24:50 № 3364006 476

>>3363983
Чел. В постгре есть встроенный механизм логгирования запросов и вообще всего что нужно в файл. Буквально первая строчка в гугле. Какие нахуй триггеры.

Аноним 17/01/25 Птн 05:30:09 № 3364252 477

Что учить, чтоб работать с sql/бд? Кем вообще можно с нуля стать без вышки и опыта? И чтоб без кодерства как такового. Ну ладно, максимум SQL, но чтоб без настоящих языков программирования.

Как ваще дела обстоят с этим? Конкуренция на уровне QA?

Аноним 17/01/25 Птн 07:49:25 № 3364277 478

>>3364252
SQL и есть настоящий язык программирования. Тьюринг полный. На нем можно даже 3д объекты рендерить https://dbfiddle.uk/WUAioX22
А если добавить PL/SQL, то вообще все что угодно можно написать.

Аноним 17/01/25 Птн 09:28:04 № 3364310 479

>>3364252
Чистый SQL это аналитика только. Будешь копаться в базах разных бизнесов. Аналитикам данных априори меньше платят чем тем же DE/DBD.

Аноним 17/01/25 Птн 10:07:27 № 3364329 480

>>3364310
всё так, аналитик - не инженерная специальность, аналитику платят за знание бизнеса/бизнес процессов, для него SQL это инструмент, а не сфера его деятельности

Аноним 17/01/25 Птн 10:29:23 № 3364346 481

>>3364329
В целом да. Но как обязательный навык SQL почти всегда. Те аналитики которые не умели в SQL это прям жалкое подобие недоспецов. Видел таких, которые знали предметную область, но банально не умели в элементарные запросы.

Аноним 17/01/25 Птн 13:11:36 № 3364518 482

>WHERE 1=1

Аноним 17/01/25 Птн 13:17:51 № 3364526 483

>>3364518
Предлагаешь прямо сейчас альтернативу или идёшь нахуй.

Аноним 17/01/25 Птн 13:55:03 № 3364548 484

>>3364526
>>3364518
>WHERE 1=1
а нахуй нужно? почему бы сразу не писать условие?

Аноним 17/01/25 Птн 14:05:36 № 3364558 485

>>3364548
Нужно для анализа разных выборок, когда одного фиксированного условия нет, и сидишь, комментируя однострочными комментариями пару десятков условий, записанных через AND.
В приложении, конечно, смысла в этом ноль.

Аноним 17/01/25 Птн 15:17:57 № 3364631 486

>>3364548
приколюха народная как "крайний" вместо "последний", виртуальный оберег запроса, пожелание на то, чтобы всё сошлось

Аноним 17/01/25 Птн 16:41:43 № 3364757 487

>>3364310
>Чистый SQL это аналитика только.
Чем вообще эти аналитки занимаются?
Вот реально кабанчик сидит и принимает стратегическое решение о развитии бизнеса на основе анализа данных?
Типа на собрании, кабанчик встает такой:
"Сегодня Аналитик предоставил отчет где видно, что продажи товара N упали на 30%. Значит надо инвестировать в рекламу!
Спасибо тебе аналитик, будешь премирован!"
Обычно бизнесмены (средний точно) и так в курсе как идет их бизнес без всяких аналитиков.

Понятно, что в каком-нибудь крупном бизнесе (банк или сеть шаурмичных) это еще востребовано.

Аноним 17/01/25 Птн 16:50:32 № 3364775 488

>>3364757
> Вот реально кабанчик сидит и принимает стратегическое решение о развитии бизнеса на основе анализа данных?
Абсолютли. Особенно в крупных компаниях. Ещё есть такое понятие как Data Driven Organisation. Все решения должны быть на основе данных, а не потому что у манагера-самодура пятка зачесалась.

> "Сегодня Аналитик предоставил отчет где видно, что продажи товара N упали на 30%. Значит надо инвестировать в рекламу!
Если серьезно, то именно так и происходит. Когда в коллекшене банка работал, то делал отчётность по эффективности отделов. Им за мои отчёты вставляли пиздов. Типа тут хули так мало, а тут вообще пиздец? Стратегическое видение тоже должно быть подкреплено данными.

> Обычно бизнесмены (средний точно) и так в курсе как идет их бизнес без всяких аналитиков.
ИП Кабаны даже смотрят метрики если они есть. И отчёты по выручке той же. Считают чистую прибыль все кто хочет управлять.

Те кто циферки не считают вот на видеорилейтед:
https://youtu.be/THruw0F0DXY?si=AZsHCAJdT_0qbTsl

Аноним 17/01/25 Птн 18:10:56 № 3364897 489

>>3364548
>>3364558

Аноним 17/01/25 Птн 18:25:10 № 3364923 490

>>3364897
Не буду тратить время на чтение нейровысеров.

Аноним 17/01/25 Птн 19:08:06 № 3364983 491

>>3364923
Там просто наглядно приведён пример того, о чём написал анон. Тут нейронка не может ошибиться.

Аноним 17/01/25 Птн 19:54:04 № 3365043 492

Screenshot 2025[...].png 168Кб, 1934x1244

>>3364548
На самом деле у тавтологии есть полезное применение. Это такой способ сказать "ну или не делай ничего".

В этом примере https://dbfiddle.uk/yR14AVU7 анон просил функцию, которая может принимать null, но возвращать при этом нормальный результат.

Если в функцию приходит null, получается выражение c.email = c.email , оптимизатор распознает тавтологию, отбрасывает условие фильтрации и выводит весь список.

Аноним 19/01/25 Вск 04:22:47 № 3366044 493

Хонсю вкотица в DBA. Есть толк от сертификатов https://postgrespro.ru/education/cert?

Или это так же бесполезно, как и серты 1С-Битрикс/1С?

Аноним 19/01/25 Вск 05:21:11 № 3366050 494

>>3366044
В этой стране сертификаты признаются только в госконторах, где бумажки всегда в приоритете над реальными умениями. Получил вышку - молодец, вот тебе 40к, закончил магистратуру - молодец, вот ещё 20, получил сертификат из утверждённого списка - ещё плюс 10, можешь гордиться зарплатой 70к до вычета.
А в остальных компаниях без разницы, где ты обучался, лишь бы умел хорошо делать рабочие задачи.

Аноним 19/01/25 Вск 21:30:10 № 3366791 495

>>3328584
а что такого с епам ?
мимо

Аноним 19/01/25 Вск 21:32:34 № 3366792 496

>>3366791
Обоссаная галера. Продавали крупным банкам мидлам по цене сеньеров.

Аноним 21/01/25 Втр 08:24:20 № 3367811 497

Шишка колом когда пишу запросы. Я почему спрашиваю: нормально ли это? У всех так? Или это какая-то болезнь?

Аноним 21/01/25 Втр 11:06:54 № 3367910 498

>>3367811
Если аналитический SELECT-запрос то норма, если DML запросы то ты извращенец.

Аноним 21/01/25 Втр 20:42:10 № 3368459 499

>>3367811
Очевидно что ты пишешь какую-то микро хуйню. Писал бы настоящие мощные пятиэкранные запросы, которые выполняются по несколько часов - умер бы от недостаточного поступления крови в мозг.

Аноним 22/01/25 Срд 17:15:06 № 3369114 500

читал тут статью про Hash Join, в целом все понятно, но смутил комментарий под статьей:
"Мораль сей басни такова: не пытайтесь угадать, хватит ли памяти под хэши.
Нужен быстрый и частый join по полям, особенно текстовым?
Сделайте отдельную колонку с хэшем.
Ну а если не частый - хотя бы CTE с хэшем."

как это будет работать? Ведь функция-хеширования выдает индекс для bucket (в случае хеш-таблиц).
Вот есть у меня таблица с текстовыми полями, другая тоже.
Если я создам отдельный столбец хешей для каждого из текст.значений, то все равно это будет рандом и всю таблицу придется один хер последовательно сканировать в случае JOIN.

Аноним 22/01/25 Срд 18:28:03 № 3369182 501

>>3369114
Не твоя проблема. Субд сама решает, какой джоин использовать.
Чтобы не было фулл скана, сделай индекс по нужному полю.

Аноним 23/01/25 Чтв 08:38:56 № 3369659 502

Аноны, подскажите.
Будет ли разница в производительности между этими двумя запросами, при условии что джоинов у меня не 2 как в примере а штук 10?

select from t1
left join t2 on t1.id = t2.par_id and (now() between t2.start_dt and t2.end_dt)
left join t3 on t1.id = t3.par_id and (now() between t3.start_dt and t3.end_dt)

with now_time as (
select now() as nt
)
select from t1
left join now_time nt on true
left join t2 on t1.id = t2.par_id and (nt.nt between t2.start_dt and t2.end_dt)
left join t3 on t1.id = t3.par_id and (nt.nt between t3.start_dt and t3.end_dt)

Т.е. я хочу чтобы now() вызывался 1 раз, вместо n-ного кол-ва раз.
Или оптимизатор в любом случае оба запроса поймёт одинаково и разницы не будет?

Аноним 23/01/25 Чтв 08:40:48 № 3369662 503

>>3369659
Фикс.
Не сказал что это postgres и проебался с разметкой в селекте

Аноним 23/01/25 Чтв 08:41:25 № 3369664 504

>>3369659
Один хер два раза вызовится в двух этих случаях. Так что похуй. Никто now() отдельно в cte не пишет. Это хуйня.

Аноним 23/01/25 Чтв 08:58:15 № 3369677 505

Без вышки можно вкотиться в Data Engineer?

Аноним 23/01/25 Чтв 10:02:45 № 3369724 506

>>3369659
Ты бы лучше думал как от лефт джойнов избавиться. Я бы сделал что-то вроде:
SELECT FROM t2 WHERE par_id IN(t1 ids...) and (now() between start_dt and end_dt)
UNION ALL
SELECT FROM t3 WHERE par_id IN(t1 ids...) and (now() between start_dt and end_dt)
А дальше или:
GROUP BY par_id
или
INNER JOIN t1
или вместе.
Главное избежать наматывания LEFT JOIN'ов. У тебя же выборка в геометрической прогрессии растет. Одна исходная строка умножается на строки в первом джойне потом умножается на строки во втором джойне. Некоторые ОРМ, которые все таблицы через LEFT JOIN объединяют, уже на пятом джойне могут выборку в несколько гигабайт дать.

Аноним 23/01/25 Чтв 12:22:04 № 3369917 507

>>3369677
Как обладатель вышки ПМиИ скажу что вышка нахуй не нужна в DE. Это плюс, но не критерий.

Аноним 23/01/25 Чтв 17:01:42 № 3370250 508

(now() between t2.start_dt and t2.end_dt)
что этот кусок кода значит?
now() это же текущее время

Аноним 23/01/25 Чтв 17:41:58 № 3370273 509

>>3370250
Проверяет, что текущее время входит в указанный диапазон.
t2.start_dt <= now() <= t2.end_dt

Аноним 23/01/25 Чтв 19:00:29 № 3370345 510

>>3369659
этот анон прав
для твоей задачи лучше использовать UNION.
плюс для эффективной работы JOIN тебе необходимо грамотно подобрать индексы для столбцов слияния.
Судя по всему на примере твой задачи Ps будет использовать
nested loops (алгоритм вложенных циклов) для каждого соединения.

P.S. сам только вкатываюсь, но уже хочу выступать в роли эксперта.

Аноним 23/01/25 Чтв 20:07:29 № 3370392 511

у меня есть две простых одинаковых тестовых таблицы(TAB1, TAB2) на 100 000 строк каждая.
TAB2 содержит внешний ключ на TAB1 по столбцу id.
create table TAB1(id SERIAL PRIMARY KEY, b text, c boolean);
create table TAB2(id FOREIGN KEY (a) REFERENCES TAB1(id), b text, c boolean);
Опыт №1
заполняю все столбцы обеих таблиц рандомным/неупорядоченными значениями. Делаю JOIN оптимизатор выбирает NESTED LOOPS.
Опыт №2
теперь заполняю id в обеих, упорядоченными значениями(1,2,3,..)
делаю JOIN ON TAB1.id = TAB2.id
оптимизатор применяет уже HASH JOIN, хотя по теории и как я ожидал он должен делать MERGE JOIN.
Почему так?
для опытом использовалась СУБД PostgreSQL

Аноним 23/01/25 Чтв 20:26:34 № 3370402 512

>>3370392
Как же вы заебали.
Создай пример здесь https://dbfiddle.uk/HuZKDYgb
Будет видно кто там куда джойнит хеш.

Аноним 23/01/25 Чтв 20:44:07 № 3370413 513

>>3370402
>Как же вы заебали.
ты не понял суть вопроса
читай внимательнее

Аноним 23/01/25 Чтв 20:56:44 № 3370432 514

>>3370413
Все я понял.
Создай таблицы и напиши запросы в фиддле, и тогла вместо твоих охуительных историй все смогут увидеть реальный эксплейн и написать тебе нормально правильный запрос, который гарантированно делает то что нужно. Вместо того чтобы работать в ебаной угадайке хиромантом.

Аноним 23/01/25 Чтв 23:29:30 № 3370525 515

>>3369917
хз, сейчас очень много желающих вкатиться, на вакансии джунов каждая мелочь может сыграть значение. И я не думаю, что вышка такая уж мелочь, на которую не обращают внимания.

Аноним 24/01/25 Птн 07:50:57 № 3370622 516

>>3370525
Помню когда устраивался на текущую работу принес им копию своего диплома бакалавра, ибо оригинал был в универе. Я тогда в маге учился.

Через год получит диплом маги. Спрашиваю, ну шо а диплом диплом магистратуры вам нужен? А мне хрюша говорит: а зачем? Я в ахуе был. Крупный банк если что.

Аноним 24/01/25 Птн 15:28:15 № 3370970 517

>>3370622
Так ясное дело не нужен, ты же уже там работал. А вот если ты вкатун среди еще 10к таких же на место, то разговор другой был бы.

Аноним 25/01/25 Суб 19:11:09 № 3372068 518

приходиться ли вам работать с таблицами от 1млрд. записей?
если да то можете привести примеры?
и еще вопрос, какой средний размер таблиц вам встречается на практике?

Аноним 25/01/25 Суб 19:24:05 № 3372083 519

>>3372068
Примеры чего? Того что в таблице с миллиардом записей миллиард записей?

Аноним 26/01/25 Вск 17:26:35 № 3372954 520

>>3372083
нет, просто таблицы с 1 млрд записей или более
id = {1, 2, 3 ... 1000000}

Аноним 26/01/25 Вск 17:35:41 № 3372960 521

>>3372083
я почему спрашиваю, сам вкатываюсь в БД (из другой сферы)
сейчас тестирую (параллельно читаю теорию) через EXPLAIN различные запросы: индексация, join и т.д.
но использую для опытов маленькие БД на (100 000 x 12 байт словно).
вот чтобы максимально видеть как это происходит в реальности, хочу имитировать реальные (условно) бд

Аноним 26/01/25 Вск 20:52:40 № 3373138 522

>>3372954
>нет, просто таблицы с 1 млрд записей или более
Тебе её содержимое сюда запостить или че?

Аноним 27/01/25 Пнд 17:07:27 № 3373790 523

>>3268780 (OP)
Здравствуйте, гайзы.

Прочитал тред по диагонали. Подскажите плиз, спросить больше не у кого.

Я простой экономист, делаю маленькие селекты на sql server. У меня не то чтобы много свободного времени, да и скрипты на sql это в целом 5% моего времени. Просто есть рабочий кхд, на котором можно тренироваться. Какие курсы/учебники я могу подрочить, чтобы выжать из sql server максимально много.

Чисто программистские роли мне не интересно. Просто хочется писать скрипты круто. Мой текущий уровень - базовые джойны, cte, tvf.

Аноним 27/01/25 Пнд 21:47:48 № 3374090 524

>>3373790
sql-ex.ru это база

Вот 10 лет лет в БД, а чисто по аналитическим SQL не одной книги не назову. Лично я навык запросов надрочил когда отчёты разрабатывал пачками в неделю. Тупо практика и разные задачи. Там же на практике обучился оптимизации.

Аноним 28/01/25 Втр 16:40:54 № 3374803 525

>>3373790
приведи пример запросов которые ты делаешь

Аноним 28/01/25 Втр 16:45:30 № 3374805 526

>>3374090
>оптимизации
как это делается?
типа как тут анон выше писал. вместо накрутки джоинов использовать UNION where. Но условно такой подход не для всех таблиц применим.
Или это больше про хинты?
Можешь привести пример из практики

Аноним 28/01/25 Втр 16:49:03 № 3374810 527

>>3374805
Самое распространенное если у тебя много сложных cte/подзапросов сделать из них временные таблицы. Можно в целом даже постоянные сделать и на основе этих таблиц уже посчитать то что тебе нужно.

Вообще нужно план запроса смотреть. А там уже определять где у тебя отстаёт. Но достаточно базу знать: меньше left join, больше временных табл вместо подзапросов, оконные функции замедляют запросы. Ну и порядок джойнов сначала джойнишь из больших табл и далее меньше. И не забывай про индексы и партиции, если они есть.

Аноним 28/01/25 Втр 17:09:24 № 3374824 528

Читаю статью из wiki(ru) про OLAP
"Например, все клиенты могут быть сгруппированы по городам или регионам страны (Запад, Восток, Север и так далее), таким образом, 50 городов, восемь регионов и две страны составят три уровня иерархии с 60-ю членами.
Также клиенты могут быть объединены по отношению к продукции; если существуют 250 продуктов по 20 категориям, три группы продукции и три производственных подразделения, то количество агрегатов составит 16 560 (????). При добавлении измерений в схему количество возможных вариантов быстро достигает десятков миллионов и более."

как они получили число 16560?
агрегат это же все по чему мы можем объеденить
кол-во (продукт категории etc)

Аноним 28/01/25 Втр 17:16:16 № 3374830 529

>>3374810
понял, спасибо

Аноним 28/01/25 Втр 18:24:07 № 3374896 530

>>3374090
Понятно. Ну ладно, я просто думал можно будет какнибудь задоджить трату 10 лет(
спасибо, что поделился ресурсом, посмотрю

>>3374803
ну вот например, я комментарии почистил и чуть сократил

create or alter view dm_deposit_effrate_catalog as
with t as (
select distinct tehproduct, period_interest
from [staging_area].[dbo].[bnkdeposit]
where period_interest is not null
and period_interest != '0'
and len(period_interest) - len(replace(period_interest, '^', '')) > 1
),
t1 as (
select row_number() over (partition by tehproduct, period_interest order by (select null)) as rn, tehproduct, period_interest, value as staging_value
from t
cross apply string_split(period_interest, '^')
),
t2 as (select tehproduct, period_interest,
case when rn % 2 = 1 then cast(staging_value as float) end as days,
case when rn % 2 = 0 then cast(staging_value as float) end as rate,
rn
from t1
),
t3 as (select t2.rn, t2.tehproduct, t2.period_interest, t2.days, lead(t2.rate) over (partition by t2.tehproduct, t2.period_interest order by t2.rn) as shifted_rate
from t2
),
t4 as ( select tehproduct, period_interest, days, shifted_rate
from t3
where days is not null and shifted_rate is not null
),
t5 as (select tehproduct, period_interest, sum(days * shifted_rate) / sum(days) as effective_rate
from t4
group by tehproduct, period_interest
)
select distinct
t4.tehproduct,
t4.period_interest,
round(t5.effective_rate,4) as effective_rate
from t4
join t5 on t4.tehproduct = t5.tehproduct and t4.period_interest = t5.period_interest

Аноним 28/01/25 Втр 21:54:40 № 3375080 531

>>3374896
Мне вот всегда интересно было, почему как доходит до базы на людей нападает какая-то ебанутая дизлексия. Они как будто соревнуются как бы по ебанутее назвать колонки и таблицы. Ну какой нахуй period_interest? Какой нахуй rn? Ну тебе самому не впадлу разгадывать эти ебаные шарады в виде т3?

Вот с этого
>when rn % 2 = 1 then cast(staging_value as float) end as days
>when rn % 2 = 0 then cast(staging_value as float) end as rate
я просто охуел.

Короче прото бля земля пухом тому кто попытается разобраться в этой хуите. Я хуй знаю для кого это написано, но не для людей точно.

Аноним 29/01/25 Срд 09:02:56 № 3375208 532

>>3375080
дядь, ты таблетки забыл принять или чего?
во-первых, я написал, что сократил и убрал комментарии, у меня все расписано, что какая строка делает, да там впринципе и так понятно
во-вторых, меня специально никто ничего не учил писать, я только книжки читал
в-третьих, если ты не понимаешь, может это из-за того, что ты неочень?
конкретно это место, разбивает по rn символы из period_interest между знаком ^, чтобы я мог отдельно взять дни и ставку и потом нормально посчитать эффективную ставку
в-четвертых, ну если ты знаешь как правильно надо делать, почему вместо попыток обосрать свои штаны, ты не скажешь, как правильно надо делать?
в-пятых, я не путаюсь
в-шестых, я не программист
в-седьмых, я с телефона писал

Аноним 29/01/25 Срд 11:46:41 № 3375311 533

>>3375208
>period_interest
>staging_value
Ты в реале такими же фразами общаешься? И таблицы в базе у тебя тоже "т3" называются? Я даже спрашивать не буду какого хуя в одной колонке куча какого-то говна, которое парсить надо.

Причем тут программирование вообще? У тебя проблема назвать вещи своими именами? dm_deposit_effrate_catalog у тебя кто-то буквы спиздил что-ли? Причем там походу вся база такая. Сначала угадай по названию поля нахуй оно надо, а потом охуей от того что там в действительности лежит.

Аноним 29/01/25 Срд 17:53:20 № 3375683 534

>>3374896
ну если в среднем ты тратишь 5% времени на это и нет желания задачки щелкать
читай про индексы и оптимизацию запросов на том же хабр
там много (уже) циклов статей про это, но на примере Postgres...
так же есть статьи по администрированию и прочее

Аноним 01/02/25 Суб 17:33:10 № 3378341 535

вы для всех таблиц создаете кластерный индекс?
если не для всех то по какому критерию определяете, что для это таблицы нужен класт.индекс, а не просто btree?
я так понимаю, что если таблица в осоновном служит для чтения данных, то можно ее "кластериозовать".
если транзакционная таблица (много вставок, удалений), то достаточно будет какого-нибудь некластерного индекса (btree, hash etc.)

Аноним 01/02/25 Суб 17:52:36 № 3378363 536

самофикс
понял, что вопрос не совсем корректный.
как я понимаю такие БД как MySQL и MS Server автоматически кластеризуют таблицу, как правило по первичному ключу
в то время как Ps фактически не поддерживает кластерный индекс

Аноним 01/02/25 Суб 21:00:56 № 3378564 537

>>3378341
>>3378363
А зачем нужен кластерный индекс?

Аноним 02/02/25 Вск 02:09:53 № 3378743 538

>>3378564
ну как минимум для более быстрого чтения данных.
Например в MySQL (InnoDb) по умолчанию данные кластеризуются (хранятя в btree кучками вместе с индексами).Сами индексы и данные будут храниться вместе на диске (в Ps наоборот отдельно). Это как минимум увеличивает кол-во чтений с диска при обращении к данным.
В PostgreSQL по умолчанию данные хранятся в Heap (упрощенно плоский список, строки друг за другом подряд в файле).При необходимости можно кластеризовать таблицу ручками, но при добавлении новых они уже не будут кластеризоваться по индексу. Значит опять надо это делать самому или через cron.
P.S. если, что я только сегодня про все это читал. Так что лучше сам изучи тему, я могу ошибаться.

Аноним 02/02/25 Вск 14:45:30 № 3378968 539

можно где нибудь скачать большую базу данных?
размером хотя бы 5 Гб, лучше конечно в районе 10.
кроме GoogleCloud и других платных сервисов.

Аноним 02/02/25 Вск 14:59:08 № 3378977 540

>>3378968
Сгенерируй, нахуя качать?
Можно взять датасеты с Kaggle, но они больше для машоба.

Аноним 02/02/25 Вск 17:03:52 № 3379040 541

Завтра первый день работы на новой работе. Дата инженер, вкатун, оче страшно, что обосрусь. Дайте советов мудрых.

Аноним 02/02/25 Вск 17:05:49 № 3379042 542

>>3379040
Нормально делай - нормально будет.

Аноним 02/02/25 Вск 17:18:13 № 3379051 543

>>3379042
Да это я умею, в плане работоспособности, ответственности и прочих софтов все заебись. А вот с хардами хз, опыта нет.

Аноним 02/02/25 Вск 18:16:18 № 3379121 544

>>3379040
Если есть Airflow то тебе надо понять суть что такое execution_date. Как оно работает. Как следующая дата выставляется. Как работают даты в airflow вообще на разных градации: час, день, месяц.

Если есть Greenplum то разберись с дистрибуцией. Heap, AO. Партиции. Хранилища вообще строятся через жопу, без индексов, без not null.

Есть есть Hadoop то почитай про файлы. Про внутреннее устройство кластера.

Аноним 02/02/25 Вск 19:58:42 № 3379197 545

>>3379040
был в такой ситуации
вкатился на работу с нулевым опытом, сразу на мидла++
совет дам тебе один только один:
Сразу ставь себя в коллективе как положено!
кто будет выебыватся, дерзи в ответ, хоть это и лид/ген.дир, похуй.
по факту это никак не повлияет на тебя (внезапно!).
потом тот же лид подходил извинялся и все уже было норм.
но будешь давать макать себя, тебя будут макать всю дорогу и с зп тоже макать.
Успехов!

Аноним 02/02/25 Вск 21:22:17 № 3379250 546

>>3379040
Тебе будут много всякого объяснять, веди записи в нотпаде. Это тебе в моменте будет казаться, что это ерунда и ты все запомнишь. Нихуя. А потом, если будешь переспрашивать - это будет только всех бесить.

Аноним 03/02/25 Пнд 01:37:42 № 3379333 547

>>3379040
все будет хорошо. первые два дня самые тяжелые
но главное не забудь в пятницу проставиться!
не скупись на поляну, если че домашнее нормальное неси.

Аноним 05/02/25 Срд 01:43:19 № 3381116 548

Крутил рулетку 1С, DBA и DevOps. Выпало 8 раз подряд DBA и после этого 1 раз DevOps. Ну на самом деле я хотел до 3 крутить. Потом ради интереса крутил - подумал, может баг какой, но нет.

В общем, буду вкатываться в DBA. Даю себе ровно 5 месяцев - до середины лета. Если я low-iq-лох, то так тому и быть — я приму этот факт и пойду работать на дноработу.

Я пишу это, чтобы весь мир знал о моих намерениях!!! Ну и ещё обоссыте, если не трудно. Хотя ладно, не надо. Во мне больше нет сомнений. Но если хотите, то пишите, что вздумается. Хотя можете не писать, я сюда снова зайду только через 5 месяцев. Но если хотите, то пишите, я вас не останавливаю. Вопрос лишь в том, хотите ли вы тратить время на сообщение, которое оставят без ответа? То-то и оно! Вдумайтесь!

Аноним 05/02/25 Срд 14:54:38 № 3381439 549

Гопота настаивает, что DROP COLUMN foo - это жирная O(n) операция, требующая эксклюзивный лок на всю таблицу. Тем временем в мане постгреса по ALTER TABLE написано вот это:
>The DROP COLUMN form does not physically remove the column, but simply makes it invisible to SQL operations. Subsequent insert and update operations in the table will store a null value for the column. Thus, dropping a column is quick but it will not immediately reduce the on-disk size of your table, as the space occupied by the dropped column is not reclaimed. The space will be reclaimed over time as existing rows are updated.
Нихуя не понимаю, где правда.

Аноним 05/02/25 Срд 15:27:08 № 3381448 550

>>3381439
Правда в том, что тебе это не нужно знать, пускай ИИ за тебя всё решает, он же тебя и заменит одним из первых.
Просто представь своё ебало, ты не веришь ОФИЦИАЛЬНОЙ ДОКУМЕНТАЦИИ и переспрашиваешь у какого-то бота.

Аноним 05/02/25 Срд 15:29:41 № 3381452 551

>>3381448
Съеби.

Аноним 06/02/25 Чтв 08:45:09 № 3382143 552

>>3381439
Ну точно не в документации. В доках исторически пишут один пиздежь, а вот жпт модели учатся только на правильных данных.

Аноним 06/02/25 Чтв 09:56:28 № 3382195 553

>>3382143
Ну откуда-то же он это взял. Кроме того, из доки это тожн неочевидно - операция, пробегающая по всей таблице, тоже может быть "быстрой", если у тебя там баснословные сто тыщщ записей и кто-то дёргает её аж целый раз в секунду - это вообще относительное понятие. А как это работает под капотом остаётся только догадываться - исходники постгреса не смотрел, да, и не пизди, что ты их смотришь каждый раз, когда возникают вопросы.

Аноним 06/02/25 Чтв 16:08:38 № 3382414 554

>>3382195
Нахуй ты сюда простишь жпт пасту?

Аноним 06/02/25 Чтв 23:39:22 № 3382707 555

ПЕРЕКАТ >>3382705 (OP)
ПЕРЕКАТ >>3382705 (OP)
ПЕРЕКАТ >>3382705 (OP)
ПЕРЕКАТ >>3382705 (OP)
ПЕРЕКАТ >>3382705 (OP)
ПЕРЕКАТ >>3382705 (OP)

Аноним 02/03/25 Вск 14:29:54 № 3400146 556

У меня сейчас выбор: после универа пойти работать в гос НИИ со средней зарплатой, но где всем пофиг что ты делаешь или через стажировку в банк, где, как я понял из треда, тебя будут выматывать постоянными созвонами и дедлайнами, но будут много платить. Что посоветуете? Есть аноны кто работал в около гос секторе?

Аноним 02/03/25 Вск 23:10:59 № 3400432 557

>>3400146
Хотел предложить банк, но после того как увидел слово стажировка фу, нахуй! могу посоветовать только НИИ. Поработай там, наберись опыта и стажа. Потом иди в частный сектор.

Аноним 18/04/25 Птн 14:44:10 № 3434057 558

сап двощ, че какие варианты развития в сис. анале есть?
сам рн мидл сис анал. По стаку питон, сиквел, пост, рест, могу в баш чуть чуть, раст+го учу. Ща миграцией одной хуйни занят на другую хуйню.