Chat Pubmed
chatpubmed.streamlit.app
Talk to PubMed directly and it will find papers related to your question. Then, it will use the content of these fulltext to answer your question.
Let's work towards extending the average lifespan of humans, in our own small way.
Chat Pubmed
chatpubmed.streamlit.app
直接与Pubmed对话,
为延长人类平均寿命做一点小小的贡献
这个项目想说的是,其实我并不需要本地收藏很多文献,也并不需要在本地存储。
向量搜索的成本还很高,所以不妨先使用传统的关键词搜索,找个大概,用向量相关性来评估关键词搜索得到的摘要的结果,找到足够多相关性高的内容后再启动全文切块向量搜索。
用同样的思路当然也可以做出chat IEEE,chat arXiv,甚至chat scihub
基本流程其实很简单。跟人类查文献看文献一样:
1.提出问题
2.GPT提取关键词
3.GPT生成检索式
4.检索文献获取摘要
5.计算摘要与问题的相关性,大于阈值找到topN篇(如果数量不够回步骤2)
6.根据文章ID获取全文(pubmed有PMC数据库
7.对全文切块向量检索问答
这里面其他都是常规动作,比较有趣的是用GPT生成检索式,当然其实也就是给提示命令它做而已。但真的做得很好,比如我问如何控制儿童近视进展,GPT能够生成(children OR pediatric) AND (myopia ...这样的检索式,
缺点是速度慢,每次GPT操作都要等,查文献部分大约要1分钟,后续每轮问答可能30秒。
还有是费钱,一次问答大约花费0.05-0.1$。
但如果和人工看文献相比,这算得了啥

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with goldengrape @goldengrape@mathstodon.xyz

goldengrape @goldengrape@mathstodon.xyz Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @goldengrape

Apr 18
有copilot,增加多语种的界面实在是太简单了。把UI上的文字放进json里,写出中文样例,后面的就一路tab就可以,copilot自行翻译。
所以现在chatpubmed chatpubmed.streamlit.app 的界面有这么多种语言的,而且你可以用母语提问,得到母语回答。 Image
我觉得这应该是每一个程序员/网站制作者都应该试试的东西,当然你们肯定比我做得更简单,比如单独写个程序用GPT去翻译所有界面上的文字。现在真的可以很简单就完成所有界面的翻译。

为什么不呢,让你的用户少一点点的困难,这不就是大家写程序的目的么
所以呢,吵吵啥AI时代要不要学英语,力所能及消灭每一个英文单词啊,不光为中文用户消灭,其他语种也就是多按几下tab而已。
能动手谁还还动口啊
Read 5 tweets
Mar 21
好吧,给个例子,其实跟把大象放进冰箱差不多。
题目:为ppt撰写演讲词
目的:读取一个ppt中的所有文本,依次为每一页撰写演讲词
1/
过程设计
1. 读取pptx文件
2. 读取ppt中每一页的文字,包括正文中的文字和备注中的文字。
3. 对于第i页,令GPT依据全部文字和第i页的文字撰写演讲词
4. 将演讲词单独保存为markdown文件

2/
函数设计
以Python撰写,以函数式编程的风格撰写结构化程序,最终以main()调用。

* 需要用的库
python-pptx, markdown
以上为人工设计,此处开始问GPT:“针对上述过程,请设计出相应的函数,列出每个函数的作用描述、输入、输出,但不必列出每个函数的具体实现。”
3/
Read 8 tweets
Mar 21
GPT4协作编程要点:
0.建立一个markdown文件记录prompt
1.写明程序目的
2.写明程序实现目的的方法/流程
3.注明编程风格,要求GPT4写出函数的作用描述、输入、输出,但不必列出函数的具体实现。
4.由GPT4生成函数设计
5.注明需要使用的库,列出库中的几个典型示例,复制之上所有部分交GPT4生成代码
6.debug,将代码和报错一起交给GPT4,询问错误出现的原因,并修改。注意GPT4的知识过时,有可能引用不存在的库中的函数方法,可能需要以ChatPDF或者Bing Chat协助或者手动找到对应的函数,并找到说明或者示例,一同交给GPT4生成新代码。
7.记录debug要点于文件中。
8. cursor.so真好用
是该把SICP再速览一遍了
Read 6 tweets
Mar 20
字幕这个事,按外语水平,可以是一个连续谱,一端是全母语字幕,另一端是无字幕。
中间可以插入一些节点,比如:
[全母语字幕, 全外文字幕], (全外文字幕, 无字幕],
在这两个区间,又可以按照词频的顺序做出连续谱。
前一区间是中外混合字幕,从逐渐加入外文常用词,到逐渐减少外文常用词对应的母语 1/
[全母语字幕, 全外文字幕]之间可以有一个全中外混排字幕的节点,每个单词对应一个母语翻译,
这个节点开始打破了母语的语序和语法,以外文方式组织。
然后随着词频,逐渐抹去高词频的母语翻译,仅保留不熟悉的生词,一直到全外文字幕节点 2/
在(全外文字幕, 无字幕]区间,用户应该已经掌握了大多数单词的词义,但听力可能还对生词难以识别,所以,仍然是按照词频由高到低的顺序,逐渐抹去高词频的外文单词,保留生词。直到无字幕 3/
Read 4 tweets
Mar 12
所以,当前简单的双语PDF思路是这样的:
1. 按页处理PDF,先提取出原文中的第i页,
2.用PyMuPDF提取text,交给ChatGPT转换成markdown
3. 每行翻译markdown,原文译文混排。
4.用mdpdf(github.com/normanlorrain/…)转换成pdf,一般1-3页。
5.将原文PDF页和双语译文PDF交叉混排,重整成新的PDF输出
这样文件虽然肥厚了不少,但是文字格式经过markdown的“展平”,具有了延展性,用来放双语会比较美观。
而图表(drawing)、插图(image)和表格,则保留原来的形态和位置,方便查阅
当然,也可以略微瘦身,就是先检查一下当前页是否有图表(drawing)和插图(image) (这俩居然是不同的),如果没有,那么就可以直接展平而不必保留源PDF页面
Read 5 tweets
Mar 11
有没有可能借助GPT把一页PDF转换成朴实的html或者markdown?

所述朴实:
1。段内没有强制换行
2。文字以顺序排列
3。插图位于段落之间
4。表格以表格形式展现
github.com/pdf2htmlEX/pdf…
看了一个pdf2htmlEX的库,越看越觉得PDF真™的是一种非常邪贱的东西
测试用PyMuPDF+ChatGPT转Markdown
prompt="convert the following text to markdown, beware the paragraph:\n\n"+text
转了DOI:10.1016/j.visres.2006.01.004前两页,
首页横排摘要和两栏正文完美转换,第2页简单数学公式和±号正确转换,虽然没有转换成LaTeX有点可惜。
接下来看看表格与插图
Read 5 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us on Twitter!

:(