-
敏感词过滤算法达成
所属栏目:[语言] 日期:2021-12-06 热度:53
敏感词、文字过滤是一个网站必不可少的功能,如何设计一个好的、高效的过滤算法是非常有必要的。 在实现文字过滤的算法中,DFA是唯一比较好的实现算法。DFA即Deterministic Finite Automaton,也就是确定有穷自动机,它是是通过event和当前的state得到下一[详细]
-
Python远程连接服务器用它就可以了
所属栏目:[语言] 日期:2021-12-06 热度:170
使用fabric玩转远程服务器管理 fabric基于强大的paramiko、invoke等库,构建出一整套简单易用的API,使得我们使用简洁的语句就可以应付常见的各种远程服务器操作,使用pip install fabric完成安装,本文演示对应版本为2.6。 1. 连接到远程服务器并执行终端[详细]
-
Go泛型系列 Maps 包有哪些?
所属栏目:[语言] 日期:2021-12-06 热度:190
真实的场景 不少新手,对 map 的输出是随机的有迷惑,曾经,map 的输出顺序是固定的,但官方怕大家依赖这个顺序,之后故意让输出顺序不固定。 但实际场景中,会有按某种顺序输出 map 的需求,怎么办呢?这需要对 map 的 key 进行排序,伪代码如下: for k :=[详细]
-
Java9异步编程-反应式流运用
所属栏目:[语言] 日期:2021-12-06 热度:114
Reactive API总览 要构建一个流,主要使用三个抽象,并将它们组合成异步处理逻辑。 每个流都需要处理由Publisher实例发布给它的事件;发布者有一个subscribe()的方法。 如果某个订阅者希望接收发布者发布的事件,则需要使用subscribe()订阅发布者。 消息的接[详细]
-
.NET Core怎样配置TLS Cipher 套件 ?
所属栏目:[语言] 日期:2021-12-06 热度:159
.NET Core Cipher(套件)配置 如果没有项目上的苛刻要求,我断然也就无法在此方面展开研究和实践 本文具以.NET 5为例,只不过针对.NET Core 3或3.1通过工具扫描出的协议套件结果略有所差异,但不影响我们对安全套件的配置,我们使用OpenSSL生成自签名证书,[详细]
-
EasyC++,名称空间其他特征
所属栏目:[语言] 日期:2021-12-06 热度:139
名称空间其他特性 嵌套 我们可以将名称空间声明进行嵌套: namespace elements { namespace fire { int flame; ... } float water; } 我们观察一下可以发现这里的flame位于elements::fire当中,所以当我们使用解析运算符使用它的时候写成:elements::fire::[详细]
-
编写无Bug Java代码的几个优秀实行
所属栏目:[语言] 日期:2021-12-06 热度:182
在编写代码时,开发人员努力以最少的复杂性和最多的功能编写没有bug的代码。无论你是初学者还是专家,都应该遵循一些规则,以便为客户机获得最佳代码。下面是无bug代码编写的规则。 规则 :不需要依赖于初始化 在Java中,开发人员总是依赖构造函数的使用来[详细]
-
长篇长论Python生成器
所属栏目:[语言] 日期:2021-12-06 热度:143
ython生成器是什么 一句话解释:包含了yield关键字的函数就是生成器,它的返回值是一个生成器对象。我简单画了个示意图: yield相当于return。 函数遇到yield就暂停,保存当前信息,返回yield的值。 在下次执行next()时,从当前位置继续执行。 比较有意思的[详细]
-
11月份Github上Java开源项目排行名单
所属栏目:[语言] 日期:2021-12-06 热度:151
QuestDB是一个高性能、开源的SQL数据库,适用于金融服务、物联网、机器学习 、DevOps和可观测性应用。它拥有支持PostgreSQL线协议的端点,使用InfluxDB线协议的模式无关的高吞吐数据获取方式,以及用于查询、批量导入和导出的REST API。QuestDB实现了ANSI[详细]
-
Go 1.18 中的 Any 是啥?
所属栏目:[语言] 日期:2021-12-06 热度:95
Go 1.18 因为泛型引入 any,这实际上是 interface{} 的别名: type any = interface{} 以下代码虽然不是泛型,但用 Go 1.18 可以正常运行,证明 any 和 interface{} 是一样的:(这里可以在线运行:https://gotipplay.golang.org/p/dPeNhe-7nkA) package mai[详细]
-
会诱发 Goroutine 挂起的 27个因素
所属栏目:[语言] 日期:2021-11-07 热度:123
上个月面向读者的提问,我们针对 goroutine 泄露中都会看到的大头 runtime.gopark 函数进行了学习和了解,输出了 《Goroutine 一泄露就看到他,这是个什么?》。 有小伙伴提到,虽然我们知道了 runtime.gopark 函数的缘起和内在,但其实没有提到 runtime.gop[详细]
-
Python项目实操篇-常用验证码标注和识别
所属栏目:[语言] 日期:2021-11-07 热度:149
大家好,我是Snowball。 一、前言 今天给大家分享的实战项目是常用验证码标注识别,从想法诞生到实现思路,再到编码实战的整体过程,这个过程我前后整理了上万字,计划分章节来发布。言归正传,一起来看看今天的内容吧!今天这篇内容主要讲解这篇文章的创作[详细]
-
适合开发者的十大优质Python编译器
所属栏目:[语言] 日期:2021-11-07 热度:65
由Guido van Rossum于1991年创建的Python,如今已是发展最快、使用最广的编程语言之一。它可以在诸如:Web应用、桌面开发、机器学习、人工智能、数据分析、以及数据可视化等领域,得到广泛的使用。 值得注意的是,近年来,随着Python生态系统的不断发展壮大[详细]
-
C#多线程研发之任务并行库
所属栏目:[语言] 日期:2021-11-07 热度:80
之前学习了线程池,知道了它有很多好处。 使用线程池可以使我们在减少并行度花销时节省操作系统资源。可认为线程池是一个抽象层,其向程序员隐藏了使用线程的细节,使我们可以专心处理程序逻辑,而不是各种线程问题。 但也不是说我们所有的项目中都上线程池[详细]
-
几行Java代码弄完图片提取文字功能
所属栏目:[语言] 日期:2021-11-07 热度:146
近日浏览网上一些图片提取文字的网站,觉得甚是有趣,花费半日也做了个在线图片识别程序,完成了两个技术方案的选择,一是 tesseract + Python flask的方案实现,二是 tesseract + Spring web 的技术解决方案,并简作论述,与君共勉。 一、tesseract-ocr介[详细]
-
Spring Boot + MyBatis + MySQL达成读写分离!
所属栏目:[语言] 日期:2021-11-07 热度:66
1、引言 读写分离要做的事情就是对于一条SQL该选择哪个数据库去执行,至于谁来做选择数据库这件事儿,无非两个,要么中间件帮我们做,要么程序自己做。 因此,一般来讲,读写分离有两种实现方式。第一种是依靠中间件(比如:MyCat),也就是说应用程序连接[详细]
-
写 Go 时怎样优雅地查文档
所属栏目:[语言] 日期:2021-11-07 热度:50
某天写代码时发现自己对 IDE 的依赖非常深,如果没了 Goland 就不会写代码了,心里为之一惊。 Goland 的自动补全功能已经是必需品了,只要打出相关的几个字符,不管是变量名还是函数调用,都能帮你直接补全。我们只需要往相应的位置填东西就行了。 进而又想[详细]
-
利用PyPolars,让Pandas快三倍
所属栏目:[语言] 日期:2021-11-07 热度:70
Pandas是数据科学家处理数据的最重要的Python软件包之一。Pandas库主要用于数据探索和可视化,它随带大量的内置函数。Pandas无法处理大型数据集,因为它无法在CPU的所有核心上扩展或分布进程。 为了加快计算速度,您可以使用CPU的所有核心,并加快工作流程[详细]
-
数据搬砖,我居然没动手!
所属栏目:[语言] 日期:2021-11-07 热度:133
自从我们的 Python技术 作为迁移后,大家留言互动好不热闹,感谢大家一如既往地支持,我将再接再厉,为大家提供更多更有用的文章。 今天我来分享一个迁移过程的幕后小故事,有料,有趣,来听听吧。 并不丝滑 迁移公众号,是一个腾讯提供的业务,就是将原公[详细]
-
.NET 6 中哈希算法的简化用途
所属栏目:[语言] 日期:2021-11-07 热度:94
Intro 微软在 .NET 6 中引入一些更简单的 API 来使用 HMAC 哈希算法(MD5/SHA1/SHA256/SHA384/SHA512) 微软的叫法叫做 HMAC One-Shoot method, HMAC 算法在普通的哈希算法基础上增加了一个 key,通过 key 提升了安全性,能够有效避免密码泄露被彩虹表反推出[详细]
-
C语言 | 函数执行成功时,return 1 还是return 0?
所属栏目:[语言] 日期:2021-11-07 热度:80
今天分享的内容是关于函数执行成功,返回0还是1的讨论~ 基本上,没有人会将大段的C语言代码全部塞入 main() 函数,更好的做法是按照复用率高,耦合性低的原则,尽可能的将代码拆分不同的功能模块,并封装成函数。C语言代码的组合千变万化,因此函数的功能可[详细]
-
Python 处理 JSON 我选择 ujson 和 orjson
所属栏目:[语言] 日期:2021-11-07 热度:144
在 Python 使用用 json.dumps(data) 时突然发现特别慢,data 本身不大,但是一个包含很多元素的列表,所以促使本人寻找一个替代的 JSON 处理库。大概对比了一个 ujson(UtltraJSON), python-rapidjson(RapidJSON) 和 Python 自带的 json 库。还有一个 simple[详细]
-
在SQLite中插入10亿条Python VS Rust
所属栏目:[语言] 日期:2021-11-07 热度:118
在实际生活中,市场有这样的案例:写脚本来进行数据处理,比如说给数据库导入导出数据,这种任务一般来说最方便的方法是用python脚本,但是如果数据量比较大时候(比如上亿条)时候Python就会超级慢,看到无法忍受。在这种案例时候该怎么做呢,有一个外国老哥[详细]
-
面试官提问什么是 Java 注解?
所属栏目:[语言] 日期:2021-11-07 热度:92
哈喽,我是狗哥。随着开发经验的累积,我越发觉得基础真的非常重要。比如:大部分框架 (如 Spring) 都使用了注解简化代码并提高编码的效率,掌握注解是一名 JAVA 程序员必备的技能。 但我发现很多工作 2、3 年的同学居然还没写过自定义注解,问起注解的原理[详细]
-
【C++】内存中的字符串
所属栏目:[语言] 日期:2021-11-07 热度:196
前文 内存中的字符串类型 学习研究了Go的字符串在内存中的结构和数据类型。 文本是两年多前的一篇学习笔记,研究的是C++字符串在内存中的结构。 环境 1. 操作系统:Ubuntu 16.04。 2. 调试软件:GNU gdb (Ubuntu 7.11.1-0ubuntu1~16.5) 7.11.1。 3. 编译工[详细]