推荐书籍及技术文档地址[置顶]

张彤 2021年10月19日 1,205次浏览

这是一个不定期更新的to_read list主要分为书籍及文档地址。

BOOK

数据库

Oracle PL/SQL程序设计(第6版)(上下册)(异步图书出品)

此书是我配合实践项目半年内学习完成的,上册主要是一些基础,下册是pl/sql的提高。

T-SQL编程入门经典涵盖SQL Server 2008&2005

本书是一些基础的t-sql语法介绍,知识点涵盖全面。

高性能MySQL(第3版)

本书非常深入的刨析了mysql。多说一句,新人入门我只推荐oracle,虽然对新手不是很友好,但是文档丰富,对于学习数据库和理解数据库都是不二的选择。

Postgresql 内幕

作者是日本的铃木广信,中文版的书籍已经上市。
如果是DBA,或者有志于postgresql生态开源代码贡献者,这本书是非常好的选择。
在这里你可以详细了解各种数据库技术的实现原理,以及系统性的学习pg的底层架构。
记得前Oracle首席架构师吐槽过mysql的底层一坨屎,建议大家转向pg.

Python

Python学习手册(套装上下册)(原书第5版) [Learning Python]

Learning python 是我的python入门书籍,由浅入深的带你走入python世界

Python Cookbook(第3版)中文版(异步图书出品)

python Cookbook 是python的魔法书,里面介绍了各种python技巧,至今翻看,仍然是趣味横生。

利用Python进行数据分析(原书第2版) [Python for Data Analysis: Data Wrangling with Pand]

除了pandas 官方文档,最好的pandas学习和入门书籍,作者Wes McKinney 是pandas库的创建者之一,目前仍然活跃在社区

机器学习及算法

机器学习实战(图灵出品) [Machine learning in action]

机器学习实战没有复杂的理论介绍,直接带你用python实现一遍,对于初学机器学习的同学比较友好,但是代码要吐槽一下,不是非常优美。当然,作为demo_code,不错了。

机器学习

周志华老师的西瓜书,经典!

精通特征工程

特征工程位于数据和模型之间,是非常重要的一环。

Excel

别怕,Excel VBA其实很简单(第3版)

这本书由国内最大的excel学习论坛excel home 集体编著,对于入门vba的同学有很大的帮助哦

Excel专业开发-Microsoft Excel及VBA应用开发指南-第2版

本书阅读是要有一定vba基础的,不适合新手,甚至你需要有点开发经验。excel也可以快速开发出易于部署的专业软件。

算法及相关

漫画算法:小灰的算法之旅(全彩)

我一般是在公众号上看小灰的请假套路:D,轻松诙谐的入门算法!

大数据

Hadoop权威指南:大数据的存储与分析(第4版)

hadoop 的经典书籍,handbook,搞清楚hadoop及其组件的原理。

Hive编程指南(异步图书出品) [Programming Hive]

hive的学习曲线相较pig比较平滑,适合dba和数据库开发等熟悉sql的人员快速上手。

HBase权威指南(异步图书出品) [HBase: The Definitive Guide]

HBase 列式存储的基本概念和原理

Spark快速大数据分析

spark 的RDD等概念和实战

Scala学习手册

scala 是大数据首选语言,有python的味道,又是出自于java jvm的静态语言,兼顾开发与性能,必学!

数据算法:Hadoop/Spark大数据处理技巧

spark生态成熟,应用广泛,自带scala和pyspark这样的接口,大数据算法走起!

分布式系统应用设计 [Designing Distributed Systems]

大数据架构师必读,设计和编写分布式应用的同学可以参考

数据密集型应用系统设计 [Designing Data-Intensive Applications]

同上,架构师和分布式设计人员的handbook

Kafka入门与实践(异步图书出品)

kafka入门书籍

DOCUMENT

PANDAS

新版的pandas文档,分了四部分,这个是pandas api的文档,熟悉python数据处理,pandas是绕不开的库。

NUMPY

调包侠和调参侠让你失去对机器学习的乐趣,来吧,用numpy实现一遍 :D

MATPLOTLIB

python 数据分析三件套中的可视化部分,虽然也有seaborn这样优秀的库,但是还是matplotlib经典

Django

虽然我更喜欢flask,但是对于新手,全家桶真的是不错的选择,文档更是没得说,可以说,django的文档是我看过最好的文档。:D

kafka

kafka 文档能够让你快速理解这个MQ,让你快速上手kafka.

scala

scala 的官方文档

python

python的官方文档,如果python是你的第二门语言,我建议直接读官方文档

scikit-learn

机器学习经典框架,3行代码训练模型,调参侠的最爱。

Pytorch

Pytorch 更动态,当然现在tf做的和pytorch没啥区别了,如果入门机器学习/平时写一些小case,请入门。

Pycharm

磨刀不误砍柴工,脑浆公司带你飞,另外还有一个DataGrip数据库IDE产品也是非常非常推荐的~:D

oracle spatial and graph data model

oracle 空间及图数据模型的官方文档,这部分是空间数据模型的文档,主要讲解笛卡尔坐标系中点,面,和多边形等的运算,当然,如果你感兴趣,完全可以实现一下,主要是使用点积和三角学知识。

Greenplum 数据库中文文档

Greenplum数据库是一种shared nothing的分析型MPP数据库

其他一些有趣的网站

wolframalpha.com

非常有趣的一个搜索引擎

leetcode

当我自满得意的时候,我就会上这个网站挨打

visualgo

数据结构有疑问?可视化帮助你理解数据结构

vs_Algorithms

旧金山大学的免费算法可视化地址,不懂btree如何构造?嗯,看这个。

IANA Service Name and Transport Protocol Port Number Registry

当你想看看端口默认是什么服务的时候,来这里。