Dawei Ma Profile picture
Mar 5, 2023 10 tweets 7 min read Read on X
#ChatGPT 昨天花了半天重温了李光耀先生的书:李光耀观天下,本来想自己写个读书小结,但这事 chatGPT 显然也可以做。于是用 gpt-index 这个库试了下,效果奇好。我导入的是英文版的 epub,然后用中文要求 chatGPT 总结或回答我的问题。由于我已经读了两遍了,不得不说,这个总结很到位。未来已来🤯
#chatGPT 把我博客的一篇中文文章(bmpi.dev/dev/renaissanc…)投喂了给它,问了几个问题,总结的都很到位,就感觉很聪明🤯不知道这个和 bingAI 相比哪个更聪明?我一直在 bingAI 的等待列表里,如果哪位大佬有 bingAI 可以对比下这两个结果的差异,不知道哪个更好一些?
#ChatGPT 导入五百多页的英文 PDF,最终抽取出 34 万的 Token,读 PDF 也毫无障碍。看起来作为一个读书智能助理已经没什么大问题了🤔
#ChatGPT 把整部西游记导入,最终产生了 178 万个 Token 🤯 整体感觉对中文的支持没有英文那么好,只能回答一些简单的问题。稍微复杂的比如孙悟空哭了几次?红孩儿的父亲是谁?这类问题就回答不出来,如果让它自由发挥,就开始胡言乱语了😂但中英文随意切换是很容易的,这点并不受语料和问题语言的限制
#ChatGPT 经过这么一番测试后我花了多少钱?gpt-index 这个库在上面的例子里我都用了两个模型:text-embedding-ada-002-v2 和 gpt-3.5-turbo-0301,前者一百万个 Token 是 0.4 刀,后者百万 Token 是 2 刀。所以今天我一共花了 2.5 刀。这成本不算低,适合做个人私有部署的小工具。
#ChatGPT 接上。可使用 gpt-index 将 text-embedding-ada-002-v2 生成的数据保存到本地,这样后续的费用就只有 gpt-3.5-turbo-0301 了,哪怕像西游记这种大部头,embedding 的费用也只有 0.4 刀,之后与 chatGPT 的交互传输的是向量化后的数字。但从账单看,也包含了输入的 Token,而且 prompt 也不小
#ChatGPT Newsletter 这些文章可以通过一个 proxy 把文章的核心内容用让 chatGPT 以中文的语言来总结下,这样读的效果应该能大幅度提升。有时间我得整一个工具出来试试。
#ChatGPT 虽然 gpt_index 可以导入 GitHub Repo,但千万不要随意尝试,刚才导入了 gpt_index 的代码库,五百多万个 Token,光 embedding 模型的费用就 2 刀了(存储到磁盘后就无需再次调用此模型了),生成了 124MB 的 index json 文件🤯 看起来这又是一个有趣的阅读开源代码的方式了,就是太烧钱了。
#ChatGPT 经过一番测试,发现用 gpt_index 读开源项目代码非常合适,适合探索类的代码阅读。如果你对一个开源项目的代码结构感觉无从下手,那与 chatGPT 一块阅读可能是非常快速的一种方式!唯一需要考虑的是代码规模,如果代码量非常多,那可能首次的 embedding 的费用要贵一些,可能需要几美元。
#ChatGPT 除了震惊还是🤯,这可能是未来读代码的神器!!!这种方式完全可以抽丝剥茧的去阅读一个大型项目的代码了,如果它有自动绘制图形的能力就完美了!
当然费用也感人,三天下来十刀没了😢

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Dawei Ma

Dawei Ma Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @madawei2699

Aug 29, 2023
分享下最近在开发时用到的一些好用的 SaaS 服务:
- 云平台: Cloudflare / Fly / AWS / Azure
- AI:OpenAI
- 支付: lemonsqueezy / Stripe / Paypal
- 分析: umami / plausible / mixpanel
- 可观测: newrelic / pagerduty / opsgenie
- FeatureToggle: optimizely

详见👇chat2invest.com

SaaS中的活菩萨,chat2invest的很多服务都是以 worker 的形式在上面免费运行,包括域名、DNS、worker(包括网关、Auth、User、Notification、LangChain等十几个服务)、R2(存放系统文件,以及数据库备份文件)、KV(键值数据库)、D1(关系数据库)、Turnstile(登陆验证码)cloudflare.com

另一个SaaS活菩萨,chat2invest中的一些数据分析服务是python开发的,我在其中部署了核心的数据服务、Nginx网关以及独立部署的PG数据库。Fly配合Cloudflare可以把AWS中大部分ECS及Serverless的服务给低成本平替掉,还自带好用的CI/CD服务,成本非常低。fly.io
Read 10 tweets
Dec 5, 2022
真是一个能帮助快速出 PoC 功能的小助手🤯
测试了半天,chatGPT实现小需求、修Bug、用TDD写代码、多语言实现都没有问题,甚至注释都给你写好了,这些代码大部分情况都是可以直接work的。虽然能力可能不及senior的程序员,但是一般Junior的程度可能真到了,或者很快就到了,以后接卡实现需求甚至直接commit代码都很完全有可能发生🤯
Read 5 tweets
Jul 7, 2022
#中文技术博客SEO优化的困境

背景是最近在做一篇文章的SEO优化,这篇文章在一些看起来Google搜索量不小的词上排入Top10了,于是决定做一些精细化的优化来提升页面排名。

但在和一个SEO优化师聊了之后,经过一些分析,决定不继续优化了。(1/8
原因是Google的中文搜索流量实在低,按英文优化方式就算能做到Top1的位置,流量可能并不高。

从Google Ads查询到这两个看起来搜索量应该不错的词每月搜索流量只有50多个,但是在Top10的页面里刚好有个站的真实搜索流量数据我是知道的(通过分析GA数据),和Google Ads的数据是相符的。(2/8
这也意味着Google中文搜索用的人并不多,用Google搜索就算是中文技术人员,一般也都喜欢用英文来搜索,导致中文的搜索量很低,就算能优化上去,性价比也很低。(3/8
Read 8 tweets
Jun 2, 2022
根据一些回复整理了下👇

从作者的角度看:

- 有自己的见解、观点和立场
- 写作目的
- 引领读者
- 真诚

从文章的角度看:

- 言之有物
- 能把事情解释清楚
- 有结构有逻辑
- 有明确的主题,并能有分析、结果与建议

从读者的角度看:

- 引起共鸣
- 有趣有干货
- 读者喜欢 Image
创作是基于品味而思考的产物,而品味又是流量的敌人,如何均衡两者之间的矛盾是创作者需要思考的:品味太高会导致受众过少,品味太低又会让作品显得平庸🤔
最近看了很多泛技术的文章。一个困惑就是一些文章从标题看不出所需要的前置背景知识。花时间读下来却疑惑更多,文章与读者阅读的鸿沟太大,也可能是文章触及了非目标读者,最终让我产生了浪费时间的感觉。有没有办法像书籍一样快速的提示文章所需的前置条件帮助读者快速甄别?
Read 6 tweets
Apr 19, 2022
最近半月频繁跑医院,现在的医院非常喜欢给病人配中药,当然真正对症下药的是西药以及一些化验报告。我娃还有我都收到了一些药理不明的中药,包括我输液也给配了一些中药(甚至包括彝药、藏药),我曾经还吃过蒙药,这些中成药共同点就是治病看缘分,一般吃不死人,副作用未知。
查了下有人说现在的医院治病靠西药,赚钱靠中药,说中药利润率高,没想到现在的西药已经卷成这样了。再联想到最近热门的王思聪手撕莲花清瘟背后的药企,以及占去三分之一运力的事情。感觉我们国家在推广中药上还是花了不少功夫,甚至制定了专门的标准来推广。但我还是想感谢西药以及背后的科学。
昨天看了一篇读库的文章,写的挺好,有点类似BBC之前拍那个病毒和细胞之战的视频。看完后突然觉得我们老祖宗实在太喜欢宏大叙事了,个体在里面只是宏大叙事的干电池,连对感冒的理解也是这样:中医理论认为,感冒是人体抵抗力下降时,受到外邪(风、寒、暑、湿、燥、火)入侵引起的。
Read 5 tweets
Mar 18, 2022
现在国内办一张储蓄卡堪比抢银行,真TM难😡
今早九点半去银行办一张储蓄卡,扫码进门被保安拦住问办卡用途,我说公司要我办,问有证明吗,有企业微信或钉钉吗,我说没有但最终让我进去等。之后等了一会大堂经理叫我填表然后问有没有公司offer,我说我有offer但我没带,她说有没有电子版,我说邮箱里但现在登录不了。最终说企业微信也可以。(1/5)
之后机器上一通操作后说办理不了,因为我之前有卡需要重新去柜台上办理,问我带现金了没,我说没有但之前卡可能有但手机银行登录不了,她让我去柜台修改密码,之后登了半天去柜台,柜台一通操作说这张卡被冻结了因为很久没有活动,之后说销卡重新去机器上办新卡。(2/5)
Read 6 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(