№ | Вопрос: | Сложность: |
1. | Объясните, как Pandas использует Cython для ускорения вычислений. | ⭐⭐⭐ |
2. | Какие есть способы управления выделением памяти для больших DataFrame? | ⭐⭐⭐ |
3. | Как выполнять join’ы в Pandas c учётом иерархических индексов? | ⭐⭐⭐ |
4. | Какие бывают стратегии параллельного выполнения операций в Pandas? | ⭐⭐⭐ |
5. | Как Pandas может быть интегрирован с другими системами для распределённых вычислений, такими как Spark? | ⭐⭐⭐ |
6. | Расскажите о процессе обработки строки с использованием регулярных выражений в DataFrame. | ⭐⭐⭐ |
7. | Как вы оптимизируете код для обработки больших наборов данных в Pandas без использования дополнительных библиотек? | ⭐⭐⭐ |
8. | Зачем и каким образом проводить тестирование кода, который включает в себя использование библиотеки Pandas? | ⭐⭐⭐ |
9. | Какие особенности Pandas необходимо учитывать при работе с временными данными в разных временных зонах? | ⭐⭐⭐ |
10. | Какие существуют подходы для уменьшения отпечатка памяти объектов DataFrame? | ⭐⭐⭐ |
11. | Какие могут быть подводные камни при использовании операций слияния (merge) с несколькими ключами? | ⭐⭐⭐ |
12. | Как вы можете использовать внешние базы данных вместе с Pandas для управления большими наборами данных? | ⭐⭐⭐ |
13. | Как в Pandas реализовать кастомную сортировку с использованием нескольких уровней мультииндекса? | ⭐⭐⭐ |
14. | Как можно программно обрабатывать изменения в API и форматах данных источников, которые влияют на импортированные данные в Pandas? | ⭐⭐⭐ |
15. | Объясните, как Pandas может быть использован в реальных проектах машинного обучения, включая предобработку данных. | ⭐⭐⭐ |
16. | Какие практики вы бы рекомендовали для эффективной работы с категориальными данными в Pandas? | ⭐⭐⭐ |
17. | Как можно выполнить сложные фильтрации с использованием строковых методов и регулярных выражений в DataFrame? | ⭐⭐⭐ |
18. | Предложите способы борьбы с проблемами ввода-вывода при сохранении/загрузке больших DataFrame. | ⭐⭐⭐ |
19. | Какие методы оптимизации закладываете вы в автоматизированные ETL-процессы на Pandas? | ⭐⭐⭐ |
20. | Какие нововведения в последних версиях Pandas вы считаете наиболее важными? | ⭐⭐⭐ |
21. | Дайте примеры использования custom aggregation в groupby для реализации сложных бизнес логик. | ⭐⭐⭐ |
22. | Объясните, как вы бы интегрировали Pandas с SQL-системами для выполнения запросов. | ⭐⭐⭐ |
23. | Какие существуют инструменты профилирования и как вы их используете для оптимизации скорости работы с Pandas? | ⭐⭐⭐ |
24. | Как вы обрабатываете хранилища данных нестандартных форматов (например, иерархические структуры данных)? | ⭐⭐⭐ |
25. | Расскажите, как можно реализовать кастомную логику заполнения пропущенных значений в DataFrame. | ⭐⭐⭐ |
26. | Какие методы инкрементальной обработки данных вы можете использовать в Pandas, и когда они бывают полезны? | ⭐⭐⭐ |
27. | Какие методы вы вероятно будете использовать для дебаггинга сложных операций в DataFrame и Series? | ⭐⭐⭐ |
28. | Какие есть подходы к масштабированию Pandas-ориентированных приложений на микросервисы? | ⭐⭐⭐ |
29. | Как вы интегрируете разработку на Pandas с системами контроля версий и CI/CD пайплайнами? | ⭐⭐⭐ |
30. | Как в Pandas реализовать условную логику, аналогичную SQL CASE WHEN ? | ⭐⭐⭐ |