在线观看日韩中文|1024成人网色www|日韩欧美高清一区二区三区|亚洲精华国产欧美,色婷婷综合久久久久中文一区二区,亚洲精品1区2区,久草在线

工程化雙鏈RNA連接酶及其用途的制作方法

文檔序號:42946221發(fā)布日期:2025-09-05 18:22閱讀:38來源:國知局

本披露涉及生物,特別是工程化雙鏈rna(dsrna)連接酶及其在工業(yè)生物催化中的應(yīng)用。本披露還涉及生產(chǎn)工程化dsrna連接酶的過程,以及通過將寡核苷酸片段與工程化dsrna連接酶接觸來生產(chǎn)寡核苷酸的方法。


背景技術(shù):

1、治療性寡核苷酸(包括小干擾rna(sirna)和抑制性反義寡核苷酸(aso))具有治療多種危及生命的疾病的潛力。近年來,獲批的基于寡核苷酸的藥物數(shù)量顯著增加,并且臨床研究中的治療性寡核苷酸數(shù)量也大幅增加(roberts,t.c.,langer,r.和wood,m.j.a.nature?reviews?drug?discovery[自然評論-藥物發(fā)現(xiàn)]2020?19:10?19,673–694(2020))。

2、為了在整個制藥行業(yè)中支持綠色合成倡議,迫切需要在覆蓋更廣泛患者人群所需的規(guī)模上可持續(xù)且經(jīng)濟的下一代寡核苷酸合成方法(mishra,m.等人current?research?ingreen?and?sustainable?chemistry[當前綠色與可持續(xù)化學(xué)研究]4,(2021))。

3、為此,生物催化更頻繁地應(yīng)用于活性藥物成分(api)的生產(chǎn)中,因為酶能夠在溫和的反應(yīng)條件下和在水介質(zhì)中進行高度選擇性轉(zhuǎn)化(mann,g.和stanger,f.v.chimia(aarau)[化學(xué)]74,407–417(2020))。短寡核苷酸片段的生物催化為目前使用的全長治療性寡核苷酸的固相化學(xué)合成提供了可持續(xù)且經(jīng)濟的替代方案。

4、較短的寡核苷酸相比于較長的寡核苷酸更容易合成且純度更高,簡化了下游處理并減少了溶劑浪費。然后這些短寡核苷酸片段可以使用核酸連接酶組合以產(chǎn)生寡核苷酸產(chǎn)物。核酸連接酶對含有藥學(xué)相關(guān)化學(xué)修飾的非天然dna/rna顯示出明顯的耐受性(kestemont,d.,herdewijn,p.和renders,m.curr?protoc?chem?biol[化學(xué)生物學(xué)實驗室指南]11,e62(2019);kestemont,d.等人chemical?communications[化學(xué)通訊]54,6408–6411(2018);和nandakumar,j.和shuman,s.molecular?cell[分子細胞]16,211–221(2004)),并且此前已描述過使用dsrna連接酶從短片段(≤9nt)開始合成sirna產(chǎn)物,包含廣泛的化學(xué)修飾,包括2’-ome、2’-f修飾核苷酸、硫代磷酸酯主鏈修飾核苷酸和用大量n-乙酰半乳糖胺(galnac)部分官能化的末端片段(mann,g.等人tetrahedron?letters[四面體快報]93,153696(2022))。

5、為了實現(xiàn)具有成本效益且可持續(xù)的工業(yè)規(guī)模的寡核苷酸生物催化,需要表現(xiàn)出高連接酶活性的酶。存在對工程化連接酶的迫切且未滿足的需求,其相對于野生型酶表現(xiàn)出改善的連接酶活性。對于從寡核苷酸片段產(chǎn)生寡核苷酸的生物催化方法也存在未滿足的需求。


技術(shù)實現(xiàn)思路

1、本披露提供了工程化雙鏈rna(dsrna)連接酶多肽。本披露還提供了工程化多肽的基因序列、包含該基因的重組表達載體、工程化宿主菌株和用于其生產(chǎn)的有效方法,以及使用工程化多肽生物催化寡核苷酸的反應(yīng)過程。

2、本文所述的工程化雙鏈rna(dsrna)連接酶多肽與它們所來源的野生型dsrna連接酶相比具有改善的催化活性。通過定向進化過程中氨基酸殘基的取代和/或缺失,本文提供的工程化多肽來源于噬菌體rb69的野生型dsrna連接酶。野生型dsrna連接酶由332個氨基酸組成并具有seq?id?no:302中所示的氨基酸序列(也可根據(jù)uniprot中的登錄號q7y4v8獲取)。

3、本披露提供了工程化雙鏈rna(dsrna)連接酶多肽,該多肽包含與選自由以下組成的組的氨基酸序列具有至少80%序列同一性的氨基酸序列:seq?id?no:304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598和600;其中工程化dsrna連接酶多肽:(a)具有dsrna連接酶活性;并且(b)不包含seq?id?no:302的氨基酸序列。

4、本披露提供了工程化雙鏈rna(dsrna)連接酶多肽,該多肽包含與選自由以下組成的組的氨基酸序列具有至少80%序列同一性的氨基酸序列:seq?id?no:636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666和668;其中工程化dsrna連接酶多肽:(a)具有dsrna連接酶活性;并且(b)不包含seq?id?no:302的氨基酸序列。

5、本披露提供了工程化雙鏈rna(dsrna)連接酶多肽,該多肽包含與選自由以下組成的組的氨基酸序列具有至少80%序列同一性的氨基酸序列:seq?id?no:304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666和668;其中工程化dsrna連接酶多肽:(a)具有dsrna連接酶活性;并且(b)不包含seq?id?no:302的氨基酸序列。

6、本披露提供了工程化雙鏈rna(dsrna)連接酶多肽,該多肽包含與選自由以下組成的組的氨基酸序列具有至少85%序列同一性的氨基酸序列:seq?id?no:304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666和668;其中工程化dsrna連接酶多肽:(a)具有dsrna連接酶活性;并且(b)不包含seq?id?no:302的氨基酸序列。

7、本披露提供了工程化雙鏈rna(dsrna)連接酶多肽,該多肽是:(a)包含選自由以下組成的組的氨基酸序列的多肽:seq?id?no:304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598和600;或(b)具有dsrna連接酶活性的多肽,該多肽包含以下氨基酸序列:具有(i)與(a)中列舉的多肽之一具有至少80%序列同一性,以及(ii)相對于(a)中列舉的所述一個氨基酸序列,取代、缺失、添加或插入一個或多個氨基酸殘基;其中工程化dsrna連接酶多肽不包含seq?id?no:302的氨基酸序列。

8、本披露提供了工程化雙鏈rna(dsrna)連接酶多肽,該多肽是:(a)包含選自由以下組成的組的氨基酸序列的多肽:seq?id?no:636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666和668;或(b)具有dsrna連接酶活性的多肽,該多肽包含以下氨基酸序列:具有(i)與(a)中列舉的多肽之一具有至少80%序列同一性,以及(ii)相對于(a)中列舉的所述一個氨基酸序列,取代、缺失、添加或插入一個或多個氨基酸殘基;其中工程化dsrna連接酶多肽不包含seq?id?no:302的氨基酸序列。

9、本披露提供了工程化雙鏈rna(dsrna)連接酶多肽,該多肽是:(a)包含選自由以下組成的組的氨基酸序列的多肽:seq?id?no:304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666和668;或(b)具有dsrna連接酶活性的多肽,該多肽包含以下氨基酸序列:具有(i)與(a)中列舉的多肽之一具有至少80%序列同一性,以及(ii)相對于(a)中列舉的所述一個氨基酸序列,取代、缺失、添加或插入一個或多個氨基酸殘基;其中工程化dsrna連接酶多肽不包含seq?id?no:302的氨基酸序列。

10、本披露提供了工程化雙鏈rna(dsrna)連接酶多肽,該多肽包含與選自由以下組成的組的氨基酸序列具有至少80%序列同一性的氨基酸序列:seq?id?no:304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666和668;其中:(a)工程化dsrna連接酶多肽具有dsrna連接酶活性;并且(b)工程化dsrna連接酶多肽的氨基酸序列包含以下氨基酸殘基中的一個或多個:x6是g或e;x7是q;x15是r、d或e;x19是q或d;x29是n或l;x36是v;x39是a;x44是v;x45是v;x46是y;x47是e;x49是g;x51是l;x53是y;x56是r或a;x57是s;x60是t、g或p;x63是s、q或g;x64是r、t、q、f、g或m;x66是f或w;x67是n;x87是t、p、k或不存在;x88是c;x89是t;x91是s;x92是d;x93是g、c或a;x103是v、c、y或t;x105是v;x107是r或t;x114是n;x122是w;x126是g;x129是n;x130是r、s或y;x131是r;x137是v或c;x144是n;x146是r;x158是w;x163是g;x173是l;x178是r;x185是k;x190是q;x196是s或c;x216是l或r;x221是i;x228是r;x230是t;x232是r;x235是a、t或g;x236是s、l或f;x237是s、q、r、l或g;x238是f;x239是g或r;x242是r或m;x243是n、s、g或m;x244是g或k;x251是d或l;x252是v;x254是k;x255是c;x258是v;x269是l;x280是w;x284是a;x285是a;x293是r;x296是r;x301是g、l、e或f;x303是q;x305是g;x313是a;x314是a或v;x325是r;以及x328是r;其中編號是指seq?id?no:302。

11、在一些實施例中,該多肽包含選自由以下組成的組的氨基酸序列:seq?id?no:370、488、526、578、588、590和592。在一些實施例中,該多肽包含seq?id?no:666的氨基酸序列。在一些實施例中,該多肽包含選自由以下組成的組的氨基酸序列:seq?id?no:370、488、526、578、588、590、592和666。

12、本披露提供了工程化雙鏈rna(dsrna)連接酶多肽,該多肽包含與選自由以下組成的組的氨基酸序列具有至少80%序列同一性的氨基酸序列:seq?id?no:370、488、526、578、588、590、592和666;其中:(a)工程化dsrna連接酶多肽具有dsrna連接酶活性;并且(b)工程化dsrna連接酶多肽的氨基酸序列包含以下氨基酸殘基中的一個或多個:x15是d或e;x19是d;x36是v;x39是a;x53是y;x185是k;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a。

13、本披露提供了工程化雙鏈rna(dsrna)連接酶多肽,該多肽包含與seq?id?no:666的氨基酸序列具有至少80%序列同一性的氨基酸序列;其中:(a)工程化dsrna連接酶多肽具有dsrna連接酶活性;并且(b)工程化dsrna連接酶多肽的氨基酸序列包含一個或多個(例如,2個或更多個、3個或更多個、4個或更多個、5個或更多個、6個或更多個、7個或更多個、8個或更多個、9個或更多個、或者全部10個)以下氨基酸殘基:x15是d;x39是a;x53是y;x185是k;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a。

14、本披露提供了工程化雙鏈rna(dsrna)連接酶多肽,該多肽包含與seq?id?no:370的氨基酸序列具有至少80%序列同一性的氨基酸序列;其中:(a)工程化dsrna連接酶多肽具有dsrna連接酶活性;并且(b)工程化dsrna連接酶多肽的氨基酸序列包含一個或多個(例如,2個或更多個、3個或更多個、或者全部4個)以下氨基酸殘基:x36是v;x39是a;x218是n;以及x221是i。

15、本披露提供了工程化雙鏈rna(dsrna)連接酶多肽,該多肽包含與seq?id?no:488的氨基酸序列具有至少80%序列同一性的氨基酸序列;其中:(a)工程化dsrna連接酶多肽具有dsrna連接酶活性;并且(b)工程化dsrna連接酶多肽的氨基酸序列包含一個或多個(例如,2個或更多個、或者全部3個)以下氨基酸殘基:x39是a;x218是n;以及x221是i。

16、本披露提供了工程化雙鏈rna(dsrna)連接酶多肽,該多肽包含與seq?id?no:526的氨基酸序列具有至少80%序列同一性的氨基酸序列;其中:(a)工程化dsrna連接酶多肽具有dsrna連接酶活性;并且(b)工程化dsrna連接酶多肽的氨基酸序列包含一個或多個(例如,2個或更多個、3個或更多個、或者全部4個)以下氨基酸殘基:x39是a;x218是n;x221是i;以及x255是c。

17、本披露提供了工程化雙鏈rna(dsrna)連接酶多肽,該多肽包含與seq?id?no:578的氨基酸序列具有至少80%序列同一性的氨基酸序列;其中:(a)工程化dsrna連接酶多肽具有dsrna連接酶活性;并且(b)工程化dsrna連接酶多肽的氨基酸序列包含一個或多個(例如,2個或更多個、3個或更多個、4個或更多個、5個或更多個、6個或更多個、7個或更多個、或者全部8個)以下氨基酸殘基:x39是a;x?53是y;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a。

18、本披露提供了工程化雙鏈rna(dsrna)連接酶多肽,該多肽包含與seq?id?no:588或590的氨基酸序列具有至少80%序列同一性的氨基酸序列;其中:(a)工程化dsrna連接酶多肽具有dsrna連接酶活性;并且(b)工程化dsrna連接酶多肽的氨基酸序列包含一個或多個(例如,2個或更多個、3個或更多個、4個或更多個、5個或更多個、6個或更多個、7個或更多個、8個或更多個、或者全部9個)以下氨基酸殘基:x15是d或e;x39是a;x53是y;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a。

19、本披露提供了工程化雙鏈rna(dsrna)連接酶多肽,該多肽包含與seq?id?no:592的氨基酸序列具有至少80%序列同一性的氨基酸序列;其中:(a)工程化dsrna連接酶多肽具有dsrna連接酶活性;并且(b)工程化dsrna連接酶多肽的氨基酸序列包含一個或多個(例如,2個或更多個、3個或更多個、4個或更多個、5個或更多個、6個或更多個、7個或更多個、8個或更多個、或者全部9個)以下氨基酸殘基:x19是d;x39是a;x53是y;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a。

20、在一些實施例中,該多肽包含選自由以下組成的組的氨基酸序列:seq?id?no:636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666和668。在一些實施例中,該多肽包含選自由以下組成的組的氨基酸序列:seq?id?no:636、638、642、646、664和666。

21、本披露還提供了工程化dsrna連接酶多肽,該多肽包含與seq?id?no:302具有至少80%序列同一性的氨基酸序列,其在相同的連接反應(yīng)條件下比包含seq?id?no:302的氨基酸序列的dsrna連接酶多肽多產(chǎn)生至少5%的寡核苷酸產(chǎn)物,其中該工程化dsrna連接酶多肽不包含seq?id?no:302的氨基酸序列。

22、在一些實施例中,連接反應(yīng)條件包括約1μm至約10mm寡核苷酸片段、atp來源、約5mm至約100mm二價陽離子和約0.5g/l至約10g/l工程化dsrna連接酶多肽、約4.0至約8.0的ph和約10℃至約50℃的溫度。在一些實施例中,atp來源包含atp,任選地化學(xué)計量過量的atp。在一些實施例中,atp來源包含:(a)多磷酸激酶(ppk);(b)多磷酸;以及(c)amp和/或atp。

23、在一些實施例中,工程化dsrna連接酶多肽的氨基酸序列包含在一個或多個選自以下的氨基酸殘基中不同于seq?id?no:302的序列的氨基酸序列:x6、x7、x15、x19、x29、x36、x39、x46、x47、x49、x51、x53、x56、x57、x60、x63、x64、x66、x67、x87、x88、x91、x93、x103、x105、x107、x114、x122、x126、x129、x130、x131、x137、x144、x146、x158、x163、x173、x178、x190、x196、x216、x218、x221、x228、x230、x232、x235、x236、x237、x238、x239、x242、x243、x244、x251、x252、x254、x255、x258、x269、x280、x284、x285、x293、x296、x301、x303、x305、x314、x325和x328,其中編號是指seq?id?no:302。

24、在一些實施例中,工程化dsrna連接酶多肽的氨基酸序列包含在一個或多個選自以下的氨基酸殘基中不同于seq?id?no:302的序列的氨基酸序列:x6、x7、x15、x19、x29、x36、x39、x44、x45、x46、x47、x49、x51、x53、x56、x57、x60、x63、x64、x66、x67、x87、x88、x89、x91、x92、x93、x103、x105、x107、x114、x122、x126、x129、x130、x131、x137、x144、x146、x158、x163、x173、x178、x185、x190、x196、x216、x218、x221、x228、x230、x232、x235、x236、x237、x238、x239、x242、x243、x244、x251、x252、x254、x255、x258、x269、x280、x284、x285、x293、x296、x301、x303、x305、x313、x314、x325和x328,其中編號是指seq?id?no:302。

25、在一些實施例中,工程化dsrna連接酶多肽的氨基酸序列包含以下氨基酸殘基中的一個或多個:x6是g;x7是q;x15是r、d或e;x19是q或d;x29是n或l;x36是v;x39是a;x46是y;x47是e;x49是g;x51是l;x53是y;x56是r或a;x57是s;x60是t、g或p;x63是s、q或g;x64是r、t、q、f、g或m;x66是f或w;x67是n;x87是t、p、k或不存在;x88是c;x91是s;x93是g、c或a;x103是v、c、y或t;x105是v;x107是r或t;x114是n;x122是w;x126是g;x129是n;x130是r、s或y;x131是r;x137是v或c;x144是n;x146是r;x158是w;x163是g;x173是l;x178是r;x190是q;x196是s或c;x216是l或r;x218是n;x221是i;x228是r;x230是t;x232是r;x235是a、t或g;x236是s、l或f;x237是s、q或r;x238是f;x239是g或r;x242是r或m;x243是n、s、g或m;x244是g或k;x251是d或l;x252是v;x254是k;x255是c;x258是v;x269是l;x280是w;x284是a;x285是a;x293是r;x296是r;x301是g、l、e或f;x303是q;x305是g;x314是a或v;x325是r;以及x328是r;其中編號是指seq?id?no:302。

26、在一些實施例中,工程化dsrna連接酶多肽的氨基酸序列包含以下氨基酸殘基中的一個或多個:x6是g或e;x7是q;x15是r、d或e;x19是q或d;x29是n或l;x36是v;x39是a;x44是v;x45是v;x46是y;x47是e;x49是g;x51是l;x53是y;x56是r或a;x57是s;x60是t、g或p;x63是s、q或g;x64是r、t、q、f、g或m;x66是f或w;x67是n;x87是t、p、k或不存在;x88是c;x89是t;x91是s;x92是d;x93是g、c或a;x103是v、c、y或t;x105是v;x107是r或t;x114是n;x122是w;x126是g;x129是n;x130是r、s或y;x131是r;x137是v或c;x144是n;x146是r;x158是w;x163是g;x173是l;x178是r;x185是k;x190是q;x196是s或c;x216是l或r;x218是n;x221是i;x228是r;x230是t;x232是r;x235是a、t或g;x236是s、l或f;x237是s、q、r、l或g;x238是f;x239是g或r;x242是r或m;x243是n、s、g或m;x244是g或k;x251是d或l;x252是v;x254是k;x255是c;x258是v;x269是l;x280是w;x284是a;x285是a;x293是r;x296是r;x301是g、l、e或f;x303是q;x305是g;x313是a;x314是a或v;x325是r;以及x328是r;其中編號是指seq?idno:302。

27、在一些實施例中,工程化dsrna連接酶多肽的氨基酸序列包含在一個或多個選自以下的氨基酸殘基中不同于seq?id?no:302的序列的氨基酸序列:x15、x19、x36、x39、x53、x218、x221、x237、x251、x255和x285,其中編號是指seq?id?no:302,并且其中該工程化dsrna連接酶多肽具有dsrna連接酶活性。

28、在一些實施例中,工程化dsrna連接酶多肽的氨基酸序列包含以下氨基酸殘基中的一個或多個:x15是d或e;x19是d;x36是v;x39是a;x53是y;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a;其中編號是指seq?id?no:302。

29、在一些實施例中,工程化dsrna連接酶多肽的氨基酸序列包含在一個或多個選自以下的氨基酸殘基中不同于seq?id?no:302的序列的氨基酸序列:x15、x19、x36、x39、x53、x185、x218、x221、x237、x251、x255和x285,其中編號是指seq?id?no:302,并且其中該工程化dsrna連接酶多肽具有dsrna連接酶活性。

30、在一些實施例中,工程化dsrna連接酶多肽的氨基酸序列包含以下氨基酸殘基中的一個或多個:x15是d或e;x19是d;x36是v;x39是a;x53是y;x185是k;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a;其中編號是指seq?id?no:302。

31、在一些實施例中,工程化dsrna連接酶多肽的氨基酸序列包含在一個或多個(例如,2個或更多個、3個或更多個、或者全部4個)選自以下的氨基酸殘基中不同于seq?id?no:302的序列的氨基酸序列:x36、x39、x218和x221,其中編號是指seq?id?no:302,并且其中該工程化dsrna連接酶多肽具有dsrna連接酶活性;任選地,其中該工程化dsrna連接酶多肽的氨基酸序列包含一個或多個(例如,2個或更多個、3個或更多個、或者全部4個)以下氨基酸殘基:x36是v;x39是a;x218是n;以及x221是i。

32、在一些實施例中,工程化dsrna連接酶多肽的氨基酸序列包含在一個或多個(例如,2個或更多個、或者全部3個)選自以下的氨基酸殘基中不同于seq?id?no:302的序列的氨基酸序列:x39、x218和x221,其中編號是指seq?id?no:302,并且其中該工程化dsrna連接酶多肽具有dsrna連接酶活性;任選地,其中該工程化dsrna連接酶多肽的氨基酸序列包含一個或多個(例如,2個或更多個、或者全部3個)以下氨基酸殘基:x39是a;x218是n;以及x221是i。

33、在一些實施例中,工程化dsrna連接酶多肽的氨基酸序列包含在一個或多個(例如,2個或更多個、3個或更多個、或者全部4個)選自以下的氨基酸殘基中不同于seq?id?no:302的序列的氨基酸序列:x39、x218、x221和x255,其中編號是指seq?id?no:302,并且其中該工程化dsrna連接酶多肽具有dsrna連接酶活性;任選地,其中工程化dsrna連接酶多肽的氨基酸序列包含一個或多個(例如,2個或更多個、3個或更多個、或者全部4個)以下氨基酸殘基:x39是a;x218是n;x221是i;以及x255是c。

34、在一些實施例中,工程化dsrna連接酶多肽的氨基酸序列包含在一個或多個(例如,2個或更多個、3個或更多個、4個或更多個、5個或更多個、6個或更多個、7個或更多個、或者全部8個)選自以下的氨基酸殘基中不同于seq?id?no:302的序列的氨基酸序列:x39、x53、x218、x221、x237、x251、x255和x285,其中編號是指seq?id?no:302,并且其中該工程化dsrna連接酶多肽具有dsrna連接酶活性;任選地,其中工程化dsrna連接酶多肽的氨基酸序列包含一個或多個(例如,2個或更多個、3個或更多個、4個或更多個、5個或更多個、6個或更多個、7個或更多個、或者全部8個)以下氨基酸殘基:x39是a;x?53是y;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a。

35、在一些實施例中,工程化dsrna連接酶多肽的氨基酸序列包含在一個或多個(例如,2個或更多個、3個或更多個、4個或更多個、5個或更多個、6個或更多個、7個或更多個、8個或更多個、或者全部9個)選自以下的氨基酸殘基中不同于seq?id?no:302的序列的氨基酸序列:x15、x39、x53、x218、x221、x237、x251、x255和x285,其中編號是指seq?id?no:302,并且其中該工程化dsrna連接酶多肽具有dsrna連接酶活性;任選地,其中該工程化dsrna連接酶多肽的氨基酸序列包含一個或多個(例如,2個或更多個、3個或更多個、4個或更多個、5個或更多個、6個或更多個、7個或更多個、8個或更多個、或者全部9個)以下氨基酸殘基:x15是e;x39是a;x?53是y;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a。

36、在一些實施例中,工程化dsrna連接酶多肽的氨基酸序列包含在一個或多個(例如,2個或更多個、3個或更多個、4個或更多個、5個或更多個、6個或更多個、7個或更多個、8個或更多個、或者全部9個)選自以下的氨基酸殘基中不同于seq?id?no:302的序列的氨基酸序列:x19、x39、x53、x218、x221、x237、x251、x255和x285,其中編號是指seq?id?no:302,并且其中該工程化dsrna連接酶多肽具有dsrna連接酶活性;任選地,其中該工程化dsrna連接酶多肽的氨基酸序列包含一個或多個(例如,2個或更多個、3個或更多個、4個或更多個、5個或更多個、6個或更多個、7個或更多個、8個或更多個、或者全部9個)以下氨基酸殘基:x19是d;x39是a;x?53是y;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a。

37、在一些實施例中,工程化dsrna連接酶多肽的氨基酸序列包含在一個或多個(例如,2個或更多個、3個或更多個、4個或更多個、5個或更多個、6個或更多個、7個或更多個、8個或更多個、9個或更多個、或者全部10個)選自以下的氨基酸殘基中不同于seq?id?no:302的序列的氨基酸序列:x15、x39、x53、x185、x218、x221、x237、x251、x255和x285,其中編號是指seq?id?no:302,并且其中該工程化dsrna連接酶多肽具有dsrna連接酶活性;任選地,其中該工程化dsrna連接酶多肽的氨基酸序列包含一個或多個(例如,2個或更多個、3個或更多個、4個或更多個、5個或更多個、6個或更多個、7個或更多個、8個或更多個、9個或更多個、或者全部10個)以下氨基酸殘基:x15是d;x39是a;x?53是y;x185是k;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a。

38、在一些實施例中,工程化dsrna連接酶多肽包含純化標簽。在一些實施例中,工程化dsrna連接酶多肽包含選自由以下組成的組的氨基酸序列:seq?id?no:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298和300。在一些實施例中,工程化dsrna連接酶多肽包含選自由以下組成的組的氨基酸序列:seq?idno:602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632和634。在一些實施例中,工程化dsrna連接酶多肽包含選自由以下組成的組的氨基酸序列:seq?id?no:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632和634。

39、本披露還提供了通過化學(xué)鍵或物理吸附方法固定在固體材料上的多肽,其中該多肽包含本文所述的工程化dsrna連接酶多肽。

40、本披露還提供了編碼本文所述的工程化dsrna連接酶多肽的多核苷酸。

41、在一些實施例中,多核苷酸包含選自以下的核酸序列:seq?id?no:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485、487、489、491、493、495、497、499、501、503、505、507、509、511、513、515、517、519、521、523、525、527、529、531、533、535、537、539、541、543、545、547、549、551、553、555、557、559、561、563、565、567、569、571、573、575、577、579、581、583、585、587、589、591、593、595、597和599。

42、在一些實施例中,多核苷酸包含選自以下的核酸序列:seq?id?no:601、603、605、607、609、611、613、615、617、619、621、623、625、627、629、631、633、635、637、639、641、643、645、647、649、651、653、655、657、659、661、663、665和667。

43、在一些實施例中,多核苷酸包含選自以下的核酸序列:(a)seq?id?no:303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485、487、489、491、493、495、497、499、501、503、505、507、509、511、513、515、517、519、521、523、525、527、529、531、533、535、537、539、541、543、545、547、549、551、553、555、557、559、561、563、565、567、569、571、573、575、577、579、581、583、585、587、589、591、593、595、597、599、635、637、639、641、643、645、647、649、651、653、655、657、659、661、663、665和667;和/或(b)seq?id?no:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、601、603、605、607、609、611、613、615、617、619、621、623、625、627、629、631和633。

44、本披露還提供了包含本文所述的多核苷酸的表達載體。在一些實施例中,載體包含質(zhì)粒、黏粒、噬菌體或病毒載體。

45、本披露還提供了包含本文所述的多核苷酸或本文所述的表達載體的宿主細胞。在一些實施例中,宿主細胞是大腸桿菌(e.coli)。

46、本披露還提供了制備工程化dsrna連接酶多肽的方法,該方法包括培養(yǎng)本文所述的宿主細胞并從培養(yǎng)物中獲得工程化dsrna連接酶多肽的步驟。

47、本披露還提供了通過培養(yǎng)本文所述的宿主細胞或根據(jù)本文所述的方法可獲得的工程化dsrna連接酶催化劑,其中所述工程化dsrna連接酶催化劑包含含有工程化dsrna連接酶多肽的細胞或培養(yǎng)液、或用其加工的物品,其中該物品是指從宿主細胞的培養(yǎng)物中獲得的提取物、通過從提取物中分離或純化工程化dsrna連接酶獲得的分離的產(chǎn)物或通過固定宿主細胞、其提取物或提取物的分離的產(chǎn)物獲得的固定的產(chǎn)物。

48、本披露進一步提供了從兩個或更多個寡核苷酸片段產(chǎn)生寡核苷酸的方法,其中該方法包括使以下接觸:(i)兩個或更多個寡核苷酸片段;(ii)本文所述的工程化dsrna連接酶多肽;(iii)atp來源;以及(iv)二價陽離子;以獲得寡核苷酸。

49、在一些實施例中,atp來源包含atp。

50、在一些實施例中,atp來源包含:(a)多磷酸激酶(ppk);(b)多磷酸;以及(c)amp和/或atp。在一些實施例中,ppk選自ppk12或ajpap。

51、在一些實施例中,方法使用亞化學(xué)計量濃度的amp和/或atp來進行。

52、在一些實施例中,多磷酸是多磷酸鹽。在一些實施例中,多磷酸鹽是多磷酸鈉(馬德雷爾鹽)或六偏磷酸鈉(格蘭漢姆鹽)。

53、在一些實施例中,二價陽離子輔因子是mg2+或mn2+。

54、在一些實施例中,方法以5-100mm,任選地30-50mm的二價陽離子濃度進行。

55、在一些實施例中,方法進一步包含純化寡核苷酸的步驟。

56、本披露還提供了本文所述的工程化dsrna連接酶多肽在從兩個或更多個寡核苷酸片段產(chǎn)生寡核苷酸中的用途。

57、在一些實施例中,寡核苷酸的長度為最多60個核苷酸。

58、在一些實施例中,每個寡核苷酸片段的長度為4-16個核苷酸,任選地長度為6-9個核苷酸。

59、在一些實施例中,一個或多個寡核苷酸片段包含一個或兩個突出端。

60、在一些實施例中,一個或多個寡核苷酸片段包含化學(xué)修飾。在一些實施例中,化學(xué)修飾選自:(a)經(jīng)修飾的主鏈,其任選地選自硫代磷酸酯(例如手性硫代磷酸酯)或甲基膦酸酯核苷酸間鍵;(b)經(jīng)修飾的核苷酸,其任選地選自2’-o-甲基(2’-ome)、2’-氟(2’-f)、2’-脫氧、2’-脫氧-2’-氟、2’-o-甲氧基乙基(2’-o-moe)、2’-o-氨基丙基(2’-o-ap)、2’-o-二甲基氨基乙基(2’-o-dmaoe)、2’-o-二甲基氨基丙基(2’-o-dmap)、2’-o-二甲基氨基乙基氧基乙基(2’-o-dmaeoe)、2’-o-n-甲基乙酰胺基(2’-o-nma)、鎖核酸(lna)、乙二醇核酸(gna)、酰胺基磷酸酯(例如酰胺基磷酸甲磺酰酯)、2’,3’-斷裂核苷酸模擬物、2’-f-阿拉伯核苷酸、脫堿基核苷酸、2’-氨基修飾的核苷酸、2’-烷基-修飾的核苷酸、嗎啉代核苷酸、乙烯基膦酸酯(例如5’乙烯基膦酸酯)和環(huán)丙基膦酸酯脫氧核糖核苷酸;和/或(c)與配體的綴合,任選地其中該配體包含一個或多個n-乙酰半乳糖胺(galnac)衍生物。

61、本披露還提供了組合物,其包含:i.本文所述的工程化dsrna連接酶多肽;ii.atp來源;以及iii.二價陽離子。

62、在一些實施例中,組合物進一步包含兩個或更多個寡核苷酸片段。

63、本披露還提供了試劑盒,其包含:i.本文所述的工程化dsrna連接酶多肽;ii.atp來源;iii.二價陽離子;以及iv.從兩個或更多個寡核苷酸片段產(chǎn)生寡核苷酸的方法的使用說明書。

64、在一些實施例中,atp來源包含atp。

65、在一些實施例中,atp來源包含:(a)多磷酸激酶(ppk);(b)多磷酸;以及(c)amp和/或atp。

66、在一些實施例中,ppk選自ppk12或ajpap。

67、在一些實施例中,多磷酸是多磷酸鹽。

68、在一些實施例中,多磷酸鹽是多磷酸鈉(馬德雷爾鹽)或六偏磷酸鈉(格蘭漢姆鹽)。

69、在一些實施例中,二價陽離子輔因子是mg2+或mn2+。

70、定義

71、除非另有明確定義,否則本披露中使用的技術(shù)和科學(xué)術(shù)語具有本發(fā)明所屬領(lǐng)域的技術(shù)人員通常理解的含義。以下參考文獻為本領(lǐng)域技術(shù)人員提供了本發(fā)明中使用的許多術(shù)語的一般定義:singleton等人,dictionary?of?microbiology?and?molecular?biology[微生物學(xué)和分子生物學(xué)詞典](第2版1994);the?cambridge?dictionary?of?science?andtechnology[劍橋科學(xué)技術(shù)詞典](walker編輯,1988);the?glossary?of?genetics[遺傳學(xué)詞匯],第5版,r.rieger等人(編輯.),springer?verlag[施普林格出版公司](1991);和hale&marham,the?harper?collins?dictionary?of?biology[哈珀柯林斯生物學(xué)詞典](1991)。如本文所用,除非另有說明,否則以下術(shù)語具有以下所賦予的含義。

72、如本披露通篇所用,冠詞例如“一個(a和an)”是指冠詞的一個或多個(例如,至少一個)語法賓語。

73、除非另有說明,否則術(shù)語“和/或”表示“和”或者“或”。

74、如本文所用,術(shù)語“約”典型地是指緊接在術(shù)語“約”之后的值。例如,“約15個或更多個核苷酸”典型地是指15個或更多個核苷酸。在一些實施例中,術(shù)語“約”包含陳述值的+/-1、2或3個值。例如,“約15個或更多個核苷酸”可以是指15+/-3個核苷酸,例如12、13、14、15、16、17、18個核苷酸。

75、術(shù)語“雙鏈rna連接酶”和“dsrna連接酶”在本文中可互換使用,是指具有dsrna連接酶活性的酶。dsrna連接酶多肽在本文中也可以稱為“dsrna連接酶催化劑”。

76、本發(fā)明的dsrna連接酶是atp依賴性核酸連接酶。如本文所用,dsrna連接酶活性典型地涉及通過以下步驟在核糖核苷酸的3’-oh與核糖核苷酸或脫氧核糖核苷酸的5’-po4之間atp依賴性形成共價鍵:(1)dsrna連接酶與atp反應(yīng)形成共價dsrna連接酶-amp中間體并釋放焦磷酸鹽;(2)amp從dsrna連接酶-amp中間體轉(zhuǎn)移至3’寡核苷酸片段的5’-磷酸,形成腺苷酸化寡核苷酸中間體;并且(3)5’寡核苷酸片段的3’-oh攻擊腺苷酸化中間體的5’磷酸,導(dǎo)致形成磷酸二酯鍵并釋放amp。

77、輔因子的化學(xué)計量濃度是在給定的連接反應(yīng)中實現(xiàn)完全連接所需的理論濃度。技術(shù)人員可以基于寡核苷酸片段的濃度和產(chǎn)生寡核苷酸產(chǎn)物所需的連接反應(yīng)的數(shù)量,容易地得出實現(xiàn)完全連接所需的atp的化學(xué)計量濃度。例如,使用1mm底物的連接反應(yīng)需要四次連接反應(yīng),其化學(xué)計量atp濃度為4mm?;瘜W(xué)計量過量的atp有助于確保實現(xiàn)完全連接。在一些實施例中,化學(xué)計量過量是實現(xiàn)完全連接所需的atp理論化學(xué)計量濃度的至少105%,例如至少110%、至少115%、至少120%、至少125%、至少130%、至少135%、至少140%、至少145%、至少150%、至少160%,至少170%、至少180%、至少190%或至少200%。

78、術(shù)語“工程化dsrna連接酶”、“工程化dsrna連接酶多肽”、“改善的dsrna連接酶多肽”和“工程化多肽”在本文中可互換使用。

79、如本文所用,術(shù)語“寡核苷酸”是指核酸,典型地包含最多100個核苷酸。如本文所用,術(shù)語“寡核苷酸產(chǎn)物”是指通過本文所述的dsdna連接酶連接兩個或更多個寡核苷酸片段而形成的寡核苷酸。寡核苷酸產(chǎn)物在本文中也簡稱為寡核苷酸。應(yīng)理解,本文所述的寡核苷酸產(chǎn)物包含rna。還應(yīng)理解,本文所述的寡核苷酸產(chǎn)物包含雙鏈區(qū)域。在一些實施例中,本文所述的寡核苷酸產(chǎn)物包含rna和dna。例如,寡核苷酸產(chǎn)物的一部分可以是雙鏈dna,而另一部分是雙鏈rna,形成dna-rna嵌合體。

80、術(shù)語“治療性寡核苷酸”是指可以提供治療效果的寡核苷酸,例如通過與生物分子相互作用和/或通過調(diào)節(jié)基因表達。治療性寡核苷酸包括但不限于rna干擾(rnai)劑和反義寡核苷酸(aso)。rnai是轉(zhuǎn)錄后靶向基因沉默技術(shù),其使用rnai劑降解包含與rnai劑相同序列的信使rna(mrna)。aso是單鏈核酸,可用于靶向來源于感興趣的基因的mrna。aso可以通過許多機制改變基因表達,包括直接空間阻斷mrna和核糖核酸酶h(rnase?h)介導(dǎo)的mrna降解。

81、作為非限制性實例,rnai劑包括sirna(小干擾rna)、dsrna(雙鏈rna)、shrna(短發(fā)夾rna)和mirna(微rna)。作為另外的非限制性實例,rnai劑還包括鎖核酸(lna)、嗎啉代、una、蘇糖核酸(tna)、乙二醇核酸(gna)、肽核酸(pna)和氟阿拉伯核酸(fana)。rnai劑還包括其中一條或多條鏈是rna、dna、lna、嗎啉代、una(解鎖核酸)、tna、gna和/或fana的混合物的分子。作為非限制性實例,rnai劑的一條或兩條鏈可以是例如rna,除了一個或多個rna核苷酸被dna、lna、嗎啉代、una、tna、gna和/或fana等替換之外。在一些實施例中,rnai劑的一條或兩條鏈可以帶切口,并且兩條鏈可以具有相同的長度,或者一條鏈可以比另一條鏈短。本發(fā)明的寡核苷酸可以是本文所述的任何rnai劑。

82、本文中的術(shù)語“寡核苷酸片段”是指可以與一個或多個另外的寡核苷酸片段連接以提供寡核苷酸(或寡核苷酸產(chǎn)物)的核酸。每個寡核苷酸片段對應(yīng)于寡核苷酸產(chǎn)物的一部分。寡核苷酸片段在本文中可稱為連接反應(yīng)的“底物”。

83、如上所述,dsrna連接酶活性涉及將5’寡核苷酸片段與3’寡核苷酸片段連接。在寡核苷酸片段的背景下,前綴5’和3’是指連接后各寡核苷酸片段在寡核苷酸產(chǎn)物中的相對位置,其中5’寡核苷酸片段位于3’寡核苷酸片段的上游(當寡核苷酸產(chǎn)物以5’至3’方向呈現(xiàn)時)。如本文所用,“5’寡核苷酸片段”典型地包含具有3’-羥基基團的3’末端核糖核苷酸。如本文所用,“3’寡核苷酸片段”包含5’-磷酸,其中5’末端核苷酸是脫氧核糖核苷酸或核糖核苷酸。

84、應(yīng)理解,在一些實施例中,寡核苷酸片段可以是3’寡核苷酸片段和5’寡核苷酸片段(例如,其中連接反應(yīng)發(fā)生在寡核苷酸片段的5’和3’末端)。例如,所述寡核苷酸片段可以提供:(i)3’寡核苷酸片段與5’寡核苷酸片段發(fā)生連接反應(yīng);以及(ii)5’寡核苷酸片段與3’寡核苷酸片段發(fā)生連接反應(yīng)。例如,圖1a中的寡核苷酸片段7提供:(i)3’寡核苷酸片段與5’寡核苷酸片段6發(fā)生連接反應(yīng),以及;(ii)5’寡核苷酸片段與3’寡核苷酸片段12發(fā)生連接反應(yīng)以提供寡核苷酸產(chǎn)物2。

85、本文中的“末端寡核苷酸片段”是指對應(yīng)于寡核苷酸產(chǎn)物的末端(例如5’或3’末端)部分的核酸。5’末端寡核苷酸片段典型地提供用于連接至3’寡核苷酸片段的5’寡核苷酸片段。3’末端寡核苷酸片段典型地提供用于連接至5’寡核苷酸片段的3’寡核苷酸片段。在一些實施例中,將5’末端寡核苷酸直接連接至3’末端寡核苷酸。在一些實施例中,5’末端寡核苷酸和3’末端寡核苷酸由一個或多個寡核苷酸片段分開。

86、在一些實施例中,本文所述的寡核苷酸片段包含rna和dna。例如,寡核苷酸片段的一部分可以是雙鏈dna,而另一部分是雙鏈rna,形成dna-rna嵌合體。

87、本文中的術(shù)語“突出端”或“核苷酸突出端”是指從雙鏈寡核苷酸的兩條鏈中的至少一條鏈的末端突出的至少一個不成對核苷酸。在一些實施例中,當一條鏈的3’-末端延伸超過另一條鏈的5’-末端時,或反之亦然,這形成核苷酸突出端,例如,不成對的核苷酸形成突出端。與第二個寡核苷酸片段的突出端互補的突出端可以稱為“黏性末端”。本文所述的寡核苷酸片段可以具有一個或兩個黏性末端。

88、“鈍”或“鈍末端”意指在雙鏈寡核苷酸的該末端處不存在不成對的核苷酸,即沒有核苷酸突出端?!扳g末端”寡核苷酸或寡核苷酸片段是在其整個長度上是雙鏈的寡核苷酸,即在分子的任一末端都沒有核苷酸突出端。

89、雙鏈核酸包含兩條反平行且基本上互補的核酸鏈,其被稱為“有義”鏈和“反義”鏈。在雙鏈rnai劑的背景下,“反義鏈”是指rnai的一條鏈,其包含與靶序列(例如,mrna序列)基本上互補的區(qū)域?!坝辛x鏈”是指rnai劑的一條鏈,其包含與反義鏈的區(qū)域基本上互補的區(qū)域。rnai劑的有義鏈和反義鏈可以分別稱為過客鏈和引導(dǎo)鏈。

90、“基本上互補”的序列可以是完全互補的,或者可以在雜交時包含一個或多個錯配,同時保留在與其最終應(yīng)用最相關(guān)的條件下雜交的能力。

91、“轉(zhuǎn)化”是指將底物酶促轉(zhuǎn)化為相應(yīng)產(chǎn)物?!稗D(zhuǎn)化百分比”或“轉(zhuǎn)化”是指在指定條件下在限定的時間段內(nèi)轉(zhuǎn)化為寡核苷酸產(chǎn)物的寡核苷酸片段的百分比。因此,連接酶的“酶活性”或“活性”可以表示為寡核苷酸片段至寡核苷酸產(chǎn)物的“轉(zhuǎn)化百分比”。

92、理想情況下,為了比較連接反應(yīng)之間的活性并考慮進樣之間峰強度的自然變化,將使用以下公式計算每份分析樣品的產(chǎn)物轉(zhuǎn)化%:

93、

94、其中εp、εs和εi分別=產(chǎn)物、底物和中間體寡核苷酸的消光系數(shù)。在一些情況下,例如使用本文所述的分析方法,不可能分離所有底物、反應(yīng)中間體和產(chǎn)物。因此,無法確定根據(jù)上述公式的轉(zhuǎn)化%。然而,在一些情況下,例如使用本文所述的分析方法,可以分離至少一種底物、反應(yīng)中間體和產(chǎn)物,例如明確限定的含有g(shù)alnac的寡核苷酸,包括含有g(shù)alnac的底物片段(例如寡核苷酸(12),如本文所述的實例中所使用的)、反應(yīng)中間體(例如,如本文所證明的寡核苷酸(14))和產(chǎn)物鏈(例如,如本文所證明的產(chǎn)物寡核苷酸(2))。因此,可以計算偽轉(zhuǎn)化%,用任意單位(au)表示,其僅考慮這些根據(jù)以下公式很好分離的物質(zhì):

95、

96、其中ε(2)、ε(12)和ε(14)分別是寡核苷酸(2)、(12)和(14)的消光系數(shù)。使用這樣的計算,au=1.0將意味著反應(yīng)中不再存在含有g(shù)alnac的底物或中間體寡核苷酸,并且它們已全部轉(zhuǎn)化為含有g(shù)alnac的產(chǎn)物(2)。實際上,對于au=1.0的樣品,色譜圖中存在的唯一其他峰與產(chǎn)物寡核苷酸(2)相對應(yīng),并且無法鑒定其他中間體或起始物料。另外,產(chǎn)物寡核苷酸(2)和(3)的比率與sirna產(chǎn)物(1)的真實標準一致。綜上所述,可以得出的結(jié)論是au=1.0是一個近似值,其基本上相當于100%轉(zhuǎn)化。

97、“改善的酶特性”是指在相同反應(yīng)條件下,與參比dsrna連接酶(例如野生型dsrna連接酶或另一種工程化dsrna連接酶)相比,對于特定目的有更好或更理想的酶特性。本披露中的工程化dsrna連接酶多肽表現(xiàn)出改善的酶特性。本文所述的工程化dsrna連接酶多肽表現(xiàn)出升高的酶活性(其可以底物轉(zhuǎn)化的百分比表示)。可改善的另外的酶特性包括但不限于熱穩(wěn)定性、ph活性特征、輔因子需求和對抑制劑的耐受性(例如,反應(yīng)組分、底物或產(chǎn)物抑制)。

98、“分離的多肽”是指與其天然相關(guān)的其他物質(zhì)(例如蛋白質(zhì)、脂質(zhì)和多核苷酸)基本上分離的多肽。該術(shù)語包括已從其天然存在的環(huán)境或表達系統(tǒng)(例如,在宿主細胞中或體外合成)中去除或純化的多肽。工程化dsrna連接酶多肽可以存在于細胞中、細胞培養(yǎng)基中或以各種形式制備,例如裂解物或分離的制劑。因此,在一些實施例中,工程化dsrna連接酶多肽可以是分離的多肽。

99、“野生型”是指在自然界中發(fā)現(xiàn)的形式。例如,野生型多肽或多核苷酸序列是存在于生物體中的序列,其可以從自然界來源分離,并且未經(jīng)手動程序有意修飾。本文所述的野生型dsrna連接酶的多肽序列由seq?id?no:302提供。如本文所用,野生型序列還可以包含純化標簽并且可以由seq?id?no:2提供。

100、術(shù)語“多核苷酸”和“核酸”在本文中可互換使用。

101、術(shù)語“蛋白質(zhì)”、“多肽”和“肽”在本文中可互換使用,表示通過酰胺鍵共價連接的至少兩個氨基酸的聚合物,無論其長度或翻譯后修飾(例如,糖基化、磷酸化、脂化、肉豆蔻?;?、泛素化等)如何。

102、當參考例如細胞、核酸或多肽使用時,“重組”或“工程化”是指材料或?qū)?yīng)于該材料的天然或天然形式的材料,其以自然界中不存在的方式被修飾,或者與之相同,但是由合成材料和/或通過使用重組技術(shù)操縱產(chǎn)生或衍生的。

103、用于遺傳編碼氨基酸的縮寫是常規(guī)的,并如下所示:

104、

105、

106、當使用三字母縮寫時,除非前面特別地有“l(fā)”或“d”,或從使用縮寫的上下文中可以明確看出,否則氨基酸可以是關(guān)于α-碳(cα)的l-或d-構(gòu)型。例如,其中“ala”表示丙氨酸,但未指定關(guān)于α-碳的構(gòu)型,“d-ala”和“l(fā)-ala”分別表示d-丙氨酸和l-丙氨酸。

107、當使用單字母縮寫時,大寫字母表示關(guān)于α-碳的l-構(gòu)型中的氨基酸,小寫字母表示關(guān)于α-碳的d-構(gòu)型中的氨基酸。例如,“a”表示l-丙氨酸,“a”表示d-丙氨酸。當多肽序列以一串單字母或三字母縮寫(或其混合)形式呈現(xiàn)時,根據(jù)常見慣例,序列以氨基(n)至羧基(c)方向呈現(xiàn)。

108、用于遺傳編碼核苷酸的縮寫是常規(guī)的,并如下所示:腺苷(a);鳥苷(g);胞苷(c);胸苷(t);和尿苷(u)。除非特別說明,否則縮寫的核苷酸可以是核糖核苷酸或2’-脫氧核糖核苷酸。核苷酸可以在單個基礎(chǔ)上或在整體基礎(chǔ)上指定為核糖核苷酸或2’-脫氧核糖核苷酸。當核酸序列以一串單字母縮寫形式呈現(xiàn)時,根據(jù)常見慣例,序列以5’至3’方向呈現(xiàn),并且不標明磷酸二酯鍵。

109、本領(lǐng)域技術(shù)人員非常了解鳥嘌呤、胞嘧啶、腺嘌呤和尿嘧啶可以被其他部分替換,而不會實質(zhì)上改變包含帶有這樣的取代部分的核苷酸的寡核苷酸的堿基配對特性。例如但不限于,包含肌苷作為其堿基的核苷酸可以與包含腺嘌呤、胞嘧啶或尿嘧啶的核苷酸堿基配對。因此,在本披露中出現(xiàn)的寡核苷酸的核苷酸序列中,含有尿嘧啶、鳥嘌呤或腺嘌呤的核苷酸可以被含有例如肌苷的核苷酸替換。在另一個實例中,寡核苷酸中任意位置的腺嘌呤和胞嘧啶可以分別被鳥嘌呤和尿嘧啶替換,以與靶mrna形成擺動堿基配對。

110、“氨基酸差異”或“殘基差異”是指多肽序列中某個位置處的氨基酸殘基相對于參比序列中相應(yīng)位置處的氨基酸殘基的差異。氨基酸差異的位置在本文中一般稱為“xn”,其中n是指殘基差異所基于的參比序列中的相應(yīng)位置。例如,“與seq?id?no:302相比在位置x6處的殘基差異”是指在對應(yīng)于seq?id?no:302的位置6的多肽位置處的氨基酸殘基的差異。因此,如果seq?id?no:302的參比多肽在位置6處有絲氨酸,則“與seq?id?no:302相比在位置x2處的殘基差異”是指在對應(yīng)于seq?id?no:302的位置6的多肽位置處除絲氨酸以外的任何殘基的氨基酸取代。

111、該位置處的特別氨基酸殘基差異可以表示為“xny”或“xn是y”,其中“xn”指定了上述參比序列中對應(yīng)的位置,以及“y”是工程化多肽中該位置處存在的殘基的單字母標識符。特別氨基酸差異也可以用常規(guī)符號“any”表示,其中a是參比序列中殘基的單字母標識符,“n”是參比序列中殘基位置的編號,以及“y”是工程化多肽中該位置處存在的殘基的單字母標識符。

112、在一些實例中,本披露的工程化多肽可包含相對于參比序列的一個或多個氨基酸殘基差異,這由相對于參比序列存在殘基差異的特定位置列表來指示。在一些實施例中,可以在工程化多肽的特定殘基位置處使用一個以上的氨基酸殘基,可將多個氨基酸殘基作為替代項列出,例如,“x19是q或d”。

113、氨基酸的缺失可以用“-”表示,例如“包含xn-的氨基酸序列”表示該氨基酸序列在與參比序列中的“xn”對應(yīng)的位置處含有缺失。“缺失”是指通過從參比多肽中去除一個或多個氨基酸來修飾多肽。缺失可以包括去除一個或多個氨基酸、兩個或更多個氨基酸、五個或更多個氨基酸、十個或更多個氨基酸、十五個或更多個氨基酸、或二十個或更多個氨基酸、酶的氨基酸總數(shù)的最多10%、或構(gòu)成參比酶的氨基酸總數(shù)的最多20%,同時保留工程化dsrna連接酶的酶活性和/或保留工程化dsrna連接酶的改善的特性。缺失可以涉及多肽的內(nèi)部部分和/或末端部分。在各種實施例中,缺失可以包括連續(xù)的區(qū)段或可以是不連續(xù)的。

114、在給定氨基酸或多核苷酸序列編號的背景下,“對應(yīng)于”、“參考于”或“相對于”是指當將給定氨基酸或多核苷酸序列與參比序列比較時指定參比序列的殘基編號。換言之,給定序列的殘基編號或殘基位置是相對于參比序列指定的,而不是通過給定氨基酸或多核苷酸序列內(nèi)殘基的實際數(shù)字位置指定的。例如,可以通過引入空位以優(yōu)化兩個序列之間的殘基匹配,從而將給定的氨基酸序列(例如工程化dsrna連接酶)與參比序列比對。在這些情況下,盡管存在空位,但給定氨基酸或多核苷酸序列中的殘基編號是相對于與其比對的參比序列進行的。

115、“參比序列”是指用作序列比較基礎(chǔ)的定義序列。參比序列可以是較大序列的子集,例如全長基因或多肽序列的片段。在一些實施例中,“參比序列”是野生型序列。在一些實施例中,“參比序列”是工程化或改變的序列。

116、確定序列同一性百分比的方法是本領(lǐng)域已知的。舉例來說,當評估序列同一性時,可以將具有確定數(shù)量的連續(xù)核苷酸或氨基酸的序列與來自本文所披露的核酸或肽序列相應(yīng)部分的核酸或肽序列(具有相同數(shù)量的連續(xù)核苷酸或氨基酸)進行比對??梢酝ㄟ^以下方法計算序列同一性百分比:確定兩個序列中出現(xiàn)相同核酸堿基或氨基酸殘基的位置數(shù)量,或者將核酸堿基或氨基酸殘基與空位進行比對以得出匹配位置的數(shù)量,將匹配位置的數(shù)量除以序列中的位置總數(shù),并將結(jié)果乘以100,從而得出序列同一性的百分比。本領(lǐng)域技術(shù)人員將理解,有許多已建立的算法可用于比對兩個序列。用于比較的序列的最佳比對可以例如通過smith和waterman,1981,adv.appl.math.[應(yīng)用數(shù)學(xué)進展]2:482的局部同源性算法、通過needleman和wunsch,1970,j.mol.biol.[分子生物學(xué)雜志]48:443的同源性比對算法、通過pearson和lipman,1988,proc.natl.acad.sci.usa[美國國家科學(xué)院院刊]85:2444的相似性方法搜索、通過這些算法的計算機化實現(xiàn)形式(gcg?wisconsin包中的gap、bestfit、fasta和tfasta)或通過目視檢查(一般參見,current?protocols?in?molecular?biology,[分子生物學(xué)實驗指南]fm?ausubel等人(編輯),current?protocols[實驗指南],jointventure?between?greene?publishing?associates,inc.and?john?wiley&sons,inc.[格林出版協(xié)會有限公司和約翰韋利父子有限公司的合資企業(yè)],(1995年增補)(ausubel))來進行。適用于確定序列同一性百分比和序列相似性百分比的算法的實例是blast和blast2.0算法,它們分別描述于altschul等人,(1990)j?mol?biol.[分子生物學(xué)雜志]215:403-410;和altschul等人,1977,nucleic?acids?res.[核酸研究]3389-3402中。用于執(zhí)行blast分析的軟件可通過美國國家生物技術(shù)信息中心網(wǎng)站公開獲得。該算法涉及首先通過鑒定查詢序列中長度為w的短字來鑒定高評分序列對(hsp),當與數(shù)據(jù)庫序列中的相同長度的字比對時,該長度為w的短字匹配或滿足一些正值閾值得分t。t被稱為鄰域字得分閾值(altschul等人,見上文)。這些最初的鄰域字命中點作為種子,用于啟動搜索以找到包含它們的更長的hsp。然后,字命中點沿著每個序列在兩個方向上擴展,遠至可以增加累積比對得分。對于核苷酸序列,使用參數(shù)m(殘基匹配配對的獎勵得分;總是>0)和n(錯配殘基的罰分;總是<0)計算累積得分。對于氨基酸序列,使用評分矩陣來計算累積得分。當出現(xiàn)以下情形時,字命中點向各方向的延伸終止:累積比對得分從其最大實現(xiàn)值下降了數(shù)量x;由于一個或多個負評分殘基比對的蓄積,累積得分走向0或更低;或到達任一序列的末端。blast算法參數(shù)w、t和x決定了比對的靈敏度和速度。blastn程序(針對核苷酸序列)默認使用字長(w)11、預(yù)期值(e)10、m=5、n=-4,并將兩條鏈的比較作為默認值。對于氨基酸序列,blastp程序默認使用字長(w)3、預(yù)期值(e)10和blosum62評分矩陣(參見henikoff和henikoff,1989,proc?natl?acad?sci?usa[美國國家科學(xué)院院刊]89:10915)。序列比對和序列同一性%的示例性確定可以采用gcg?wisconsin軟件包(阿賽樂德公司(accelrys),威斯康星州麥迪遜(madison?wi))中的bestfit或gap程序,使用提供的默認參數(shù)。

117、應(yīng)理解,無論與參比序列的序列同一性百分比如何,工程化dsrna連接酶都具有dsrna連接酶活性。

118、“合適的反應(yīng)條件”是指反應(yīng)系統(tǒng)中底物轉(zhuǎn)化為所期望產(chǎn)物的那些條件(例如,酶負載、底物負載、溫度、ph等)。本領(lǐng)域技術(shù)人員可以容易地確定合適的反應(yīng)條件。示例性“合適的反應(yīng)條件”在本披露中提供并通過實例說明。

119、工程化dsrna連接酶多肽

120、本披露提供了工程化dsrna連接酶多肽,該多肽包含選自由以下組成的組的氨基酸序列:seq?id?no:304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598和600。

121、本披露提供了工程化dsrna連接酶多肽,該多肽包含選自由以下組成的組的氨基酸序列:seq?id?no:636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666和668。

122、本披露提供了工程化dsrna連接酶多肽,該多肽包含選自由以下組成的組的氨基酸序列:seq?id?no:304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666和668。

123、本披露還提供了工程化dsrna連接酶多肽,該多肽具有dsrna連接酶活性并且包含與選自由以下組成的組的氨基酸序列具有至少80%序列同一性的氨基酸序列:seq?id?no:304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598和600,其中該工程化dsrna連接酶多肽不包含seq?id?no:302的氨基酸序列。

124、本披露還提供了工程化dsrna連接酶多肽,該多肽具有dsrna連接酶活性并且包含與選自由以下組成的組的氨基酸序列具有至少80%序列同一性的氨基酸序列:seq?id?no:636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666和668,其中該工程化dsrna連接酶多肽不包含seq?id?no:302的氨基酸序列。

125、本披露還提供了工程化dsrna連接酶多肽,該多肽具有dsrna連接酶活性并且包含與選自由以下組成的組的氨基酸序列具有至少80%序列同一性的氨基酸序列:seq?id?no:304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666和668,其中該工程化dsrna連接酶多肽不包含seq?id?no:302的氨基酸序列。

126、本披露提供了工程化雙鏈rna(dsrna)連接酶多肽,該多肽是:(a)包含選自由以下組成的組的氨基酸序列的多肽:seq?id?no:304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598和600;或(b)具有dsrna連接酶活性的多肽,該多肽包含以下氨基酸序列:具有(i)與(a)中列舉的多肽之一具有至少80%序列同一性,以及(ii)相對于(a)中列舉的所述一個氨基酸序列,取代、缺失、添加或插入一個或多個氨基酸殘基;其中工程化dsrna連接酶多肽不包含seq?id?no:302的氨基酸序列。

127、本披露提供了工程化雙鏈rna(dsrna)連接酶多肽,該多肽是:(a)包含選自由以下組成的組的氨基酸序列的多肽:seq?id?no:636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666和668;或(b)具有dsrna連接酶活性的多肽,該多肽包含以下氨基酸序列:具有(i)與(a)中列舉的多肽之一具有至少80%序列同一性,以及(ii)相對于(a)中列舉的所述一個氨基酸序列,取代、缺失、添加或插入一個或多個氨基酸殘基;其中工程化dsrna連接酶多肽不包含seq?id?no:302的氨基酸序列。

128、本披露提供了工程化雙鏈rna(dsrna)連接酶多肽,該多肽是:(a)包含選自由以下組成的組的氨基酸序列的多肽:seq?id?no:304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666和668;或(b)具有dsrna連接酶活性的多肽,該多肽包含以下氨基酸序列:具有(i)與(a)中列舉的多肽之一具有至少80%序列同一性,以及(ii)相對于(a)中列舉的所述一個氨基酸序列,取代、缺失、添加或插入一個或多個氨基酸殘基;其中工程化dsrna連接酶多肽不包含seq?id?no:302的氨基酸序列。

129、在一些實施例中,工程化dsrna連接酶多肽包含與seq?id?no:304-600的偶數(shù)編號序列標識符具有至少85%序列同一性的氨基酸序列,任選地與seq?id?no:304-600的偶數(shù)編號序列標識符有至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%的序列同一性。在一些實施例中,工程化dsrna連接酶多肽包含與seq?id?no:304-600的偶數(shù)編號序列標識符具有至少80%序列同一性的氨基酸序列,任選地與seq?id?no:304-600的偶數(shù)編號序列標識符有至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%的序列同一性。

130、在一些實施例中,工程化dsrna連接酶多肽包含與seq?id?no:636-668的偶數(shù)編號序列標識符具有至少80%序列同一性的氨基酸序列,任選地與seq?id?no:636-668的偶數(shù)編號序列標識符有至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%的序列同一性。

131、在一些實施例中,工程化dsrna連接酶多肽包含與seq?id?no:304-600或636-668的偶數(shù)編號序列標識符具有至少80%序列同一性的氨基酸序列,任選地與seq?id?no:304-600或636-668的偶數(shù)編號序列標識符有至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%的序列同一性。

132、由seq?id?no:304至600和636至668的偶數(shù)編號序列標識符表示的工程化dsrna連接酶多肽表現(xiàn)出比seq?id?no:302更高的活性,如實例中所示。實例中使用的dsrna連接酶多肽(分別由seq?id?no:4至300和602至634的偶數(shù)編號序列標識符表示)包含seq?id?no:304至600和636至668的偶數(shù)編號序列標識符以及n-末端純化標簽(mhhhhhhenlyfqs(seqid?no:669))。例如,seq?id?no:4包含:(i)n-末端純化標簽mhhhhhhenlyfqs(seq?id?no:669);以及(ii)seq?id?no:304。由seq?id?no:304至600和636至668的偶數(shù)編號序列標識符表示的dsrna連接酶多肽不包含由seq?id?no:669表示的n-末端純化標簽。

133、野生型dsrna連接酶多肽包含seq?id?no:302的氨基酸序列(也可根據(jù)uniprot登錄號q7y4v8獲取)。seq?id?no:2包含:(i)n-末端純化標簽mhhhhhhenlyfqs(seq?id?no:669);以及(ii)seq?id?no:302。容易理解的是,seq?id?no:2和302均包含野生型dsrna連接酶多肽序列,因此這兩個序列在本文中可稱為野生型序列。

134、在一些實施例中,工程化dsrna連接酶多肽包含選自由以下組成的組的氨基酸序列:seq?id?no:370、488、526、578、588、590和592。在一些實施例中,工程化dsrna連接酶多肽包含seq?id?no:666的氨基酸序列。在一些實施例中,工程化dsrna連接酶多肽包含選自由以下組成的組的氨基酸序列:seq?id?no:370、488、526、578、588、590、592和666。在一些實施例中,工程化dsrna連接酶多肽包含選自由以下組成的組的氨基酸序列:seq?id?no:70、188、226、278、288、290和292。在一些實施例中,工程化dsrna連接酶多肽包含seq?idno:632的氨基酸序列。在一些實施例中,工程化dsrna連接酶多肽包含選自由以下組成的組的氨基酸序列:seq?id?no:70、188、226、278、288、290、292和632。seq?id?no:70、188、226、278、288、290、292和632包含:(i)n-末端純化標簽mhhhhhhenlyfqs(seq?id?no:669);以及(ii)分別由seq?id?no:370、488、526、578、588、590、592和666提供的氨基酸序列。

135、在一些實施例中,工程化dsrna連接酶多肽包含seq?id?no:370的氨基酸序列。在一些實施例中,工程化dsrna連接酶多肽包含seq?id?no:488的氨基酸序列。在一些實施例中,工程化dsrna連接酶多肽包含seq?id?no:526的氨基酸序列。在一些實施例中,工程化dsrna連接酶多肽包含seq?id?no:578的氨基酸序列。在一些實施例中,工程化dsrna連接酶多肽包含seq?id?no:588的氨基酸序列。在一些實施例中,工程化dsrna連接酶多肽包含seqid?no:590的氨基酸序列。在一些實施例中,工程化dsrna連接酶多肽包含seq?id?no:592的氨基酸序列。在一些實施例中,工程化dsrna連接酶多肽包含seq?id?no:666的氨基酸序列。

136、本披露還提供了工程化dsrna連接酶多肽,該多肽包含與seq?id?no:302具有至少80%序列同一性的氨基酸序列,其在相同的連接反應(yīng)條件下比包含seq?id?no:302的氨基酸序列的dsrna連接酶多肽多產(chǎn)生至少5%的寡核苷酸產(chǎn)物,其中該工程化dsrna連接酶多肽不包含seq?id?no:302的氨基酸序列。在一些實施例中,與包含seq?id?no:302的氨基酸序列的dsrna連接酶多肽相比,在相同連接反應(yīng)條件下,工程化dsrna連接酶多肽產(chǎn)生至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少75%、至少80%、至少85%、至少90%、至少95%或至少100%更多寡核苷酸產(chǎn)物。在一些實施例中,連接反應(yīng)條件如本文所述。

137、在一些實施例中,工程化dsrna連接酶多肽包含與seq?id?no:302具有至少85%序列同一性的氨基酸序列,任選地與seq?id?no:302具有至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%的序列同一性。

138、在一些實施例中,工程化dsrna連接酶多肽包含與seq?id?no:302具有至少80%序列同一性的氨基酸序列,任選地與seq?id?no:302具有至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%的序列同一性。

139、在一些實施例中,連接反應(yīng)條件包括約1μm至約10mm寡核苷酸片段、atp來源、約5mm至約100mm二價陽離子和約0.5g/l至約10g/l工程化dsrna連接酶多肽、約4.0至約8.0的ph和約10℃至約50℃的溫度。在一些實施例中,atp來源是化學(xué)計量濃度的atp或化學(xué)計量過量的atp。在一些實施例中,atp來源包含:(a)多磷酸激酶(ppk);(b)多磷酸;以及(c)amp和/或atp。

140、在一些實施例中,工程化dsrna連接酶多肽包含在一個或多個(例如,兩個或更多個、三個或更多個、四個或更多個、五個或更多個、六個或更多個、七個或更多個、八個或更多個、九個或更多個、或者十個或更多個)選自以下的氨基酸殘基中不同于seq?id?no:302的序列的氨基酸序列:x6、x7、x15、x19、x29、x36、x39、x46、x47、x49、x51、x53、x56、x57、x60、x63、x64、x66、x67、x87、x88、x91、x93、x103、x105、x107、x114、x122、x126、x129、x130、x131、x137、x144、x146、x158、x163、x173、x178、x190、x196、x216、x218、x221、x228、x230、x232、x235、x236、x237、x238、x239、x242、x243、x244、x251、x252、x254、x255、x258、x269、x280、x284、x285、x293、x296、x301、x303、x305、x314、x325和x328,其中編號是指seq?id?no:302。在一些實施例中,工程化dsrna連接酶多肽包含在一個或多個(例如,兩個或更多個、三個或更多個、四個或更多個、五個或更多個、六個或更多個、七個或更多個、八個或更多個、九個或更多個、或者十個或更多個)選自以下的氨基酸殘基中不同于seq?id?no:302的序列的氨基酸序列:x6、x7、x15、x19、x29、x36、x39、x44、x45、x46、x47、x49、x51、x53、x56、x57、x60、x63、x64、x66、x67、x87、x88、x89、x91、x92、x93、x103、x105、x107、x114、x122、x126、x129、x130、x131、x137、x144、x146、x158、x163、x173、x178、x185、x190、x196、x216、x218、x221、x228、x230、x232、x235、x236、x237、x238、x239、x242、x243、x244、x251、x252、x254、x255、x258、x269、x280、x284、x285、x293、x296、x301、x303、x305、x313、x314、x325和x328,其中編號是指seq?id?no:302。

141、在一些實施例中,工程化dsrna連接酶多肽包含含有一個或多個(例如,兩個或更多個、三個或更多個、四個或更多個、五個或更多個、六個或更多個、七個或更多個、八個或更多個、九個或更多個、或者十個或更多個)以下氨基酸殘基的氨基酸序列:x6是g;x7是q;x15是r、d或e;x19是q或d;x29是n或l;x36是v;x39是a;x46是y;x47是e;x49是g;x51是l;x53是y;x56是r或a;x57是s;x60是t、g或p;x63是s、q或g;x64是r、t、q、f、g或m;x66是f或w;x67是n;x87是t、p、k或不存在;x88是c;x91是s;x93是g、c或a;x103是v、c、y或t;x105是v;x107是r或t;x114是n;x122是w;x126是g;x129是n;x130是r、s或y;x131是r;x137是v或c;x144是n;x146是r;x158是w;x163是g;x173是l;x178是r;x190是q;x196是s或c;x216是l或r;x218是n;x221是i;x228是r;x230是t;x232是r;x235是a、t或g;x236是s、l或f;x237是s、q或r;x238是f;x239是g或r;x242是r或m;x243是n、s、g或m;x244是g或k;x251是d或l;x252是v;x254是k;x255是c;x258是v;x269是l;x280是w;x284是a;x285是a;x293是r;x296是r;x301是g、l、e或f;x303是q;x305是g;x314是a或v;x325是r;以及x328是r;其中編號是指seq?idno:302。在一些實施例中,工程化dsrna連接酶多肽包含含有一個或多個(例如,兩個或更多個、三個或更多個、四個或更多個、五個或更多個、六個或更多個、七個或更多個、八個或更多個、九個或更多個、或者十個或更多個)以下氨基酸殘基的氨基酸序列:x6是g或e;x7是q;x15是r、d或e;x19是q或d;x29是n或l;x36是v;x39是a;x44是v;x45是v;x46是y;x47是e;x49是g;x51是l;x53是y;x56是r或a;x57是s;x60是t、g或p;x63是s、q或g;x64是r、t、q、f、g或m;x66是f或w;x67是n;x87是t、p、k或不存在;x88是c;x89是t;x91是s;x92是d;x93是g、c或a;x103是v、c、y或t;x105是v;x107是r或t;x114是n;x122是w;x126是g;x129是n;x130是r、s或y;x131是r;x137是v或c;x144是n;x146是r;x158是w;x163是g;x173是l;x178是r;x185是k;x190是q;x196是s或c;x216是l或r;x218是n;x221是i;x228是r;x230是t;x232是r;x235是a、t或g;x236是s、l或f;x237是s、q、r、l或g;x238是f;x239是g或r;x242是r或m;x243是n、s、g或m;x244是g或k;x251是d或l;x252是v;x254是k;x255是c;x258是v;x269是l;x280是w;x284是a;x285是a;x293是r;x296是r;x301是g、l、e或f;x303是q;x305是g;x313是a;x314是a或v;x325是r;以及x328是r;其中編號是指seq?id?no:302。

142、在一些實施例中,工程化dsrna連接酶多肽包含在一個或多個(例如,2個或更多個、3個或更多個、4個或更多個、5個或更多個、6個或更多個、7個或更多個、8個或更多個、9個或更多個、10個或更多個或者11個)選自以下的氨基酸殘基中不同于seq?id?no:302的序列的氨基酸序列:x15、x19、x36、x39、x53、x218、x221、x237、x251、x255和x285;其中編號是指seq?id?no:302。在一些實施例中,工程化dsrna連接酶多肽包含含有一個或多個(例如,2個或更多個、3個或更多個、4個或更多個、5個或更多個、6個或更多個、7個或更多個、8個或更多個、9個或更多個、10個或更多個、或者11個)以下氨基酸殘基的氨基酸序列:x15是d或e;x19是d;x36是v;x39是a;x53是y;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a;其中編號是指seq?id?no:302。

143、在一些實施例中,工程化dsrna連接酶多肽包含在一個或多個(例如,2個或更多個、3個或更多個、4個或更多個、5個或更多個、6個或更多個、7個或更多個、8個或更多個、9個或更多個、10個或更多個、11個或更多個、或者12個)選自以下的氨基酸殘基中不同于seqid?no:302的序列的氨基酸序列:x15、x19、x36、x39、x53、x185、x218、x221、x237、x251、x255和x285;其中編號是指seq?id?no:302。在一些實施例中,工程化dsrna連接酶多肽包含含有一個或多個(例如,2個或更多個、3個或更多個、4個或更多個、5個或更多個、6個或更多個、7個或更多個、8個或更多個、9個或更多個、10個或更多個、11個或更多個、或者12個)以下氨基酸殘基的氨基酸序列:x15是d或e;x19是d;x36是v;x39是a;x53是y;x185是k;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a;其中編號是指seq?id?no:302。

144、在一些實施例中,工程化dsrna連接酶多肽包含在一個或多個(例如,兩個或更多個或者三個或更多個)選自以下的氨基酸殘基中不同于seq?id?no:302的序列的氨基酸序列:x36、x39、x218和x221;其中編號是指seq?id?no:302。在一些實施例中,工程化dsrna連接酶多肽包含含有一個或多個(例如,兩個或更多個或者三個或更多個)以下氨基酸殘基的氨基酸序列:x36是v;x39是a;x218是n;以及x221是i;其中編號是指seq?id?no:302。

145、在一些實施例中,工程化dsrna連接酶多肽包含在以下氨基酸殘基上不同于seqid?no:302的序列的氨基酸序列:x36、x39、x218和x221;其中編號是指seq?id?no:302。在一些實施例中,工程化dsrna連接酶多肽包含含有以下氨基酸殘基的氨基酸序列:x36是v;x39是a;x218是n;以及x221是i;其中編號是指seq?id?no:302。

146、在一些實施例中,工程化dsrna連接酶多肽包含在一個或多個(例如,兩個或更多個)選自以下的氨基酸殘基中不同于seq?id?no:302的序列的氨基酸序列:x39、x218和x221;其中編號是指seq?id?no:302。在一些實施例中,工程化dsrna連接酶多肽包含含有一個或多個(例如,兩個或更多個)以下氨基酸殘基的氨基酸序列:x39是a;x218是n;以及x221是i;其中編號是指seq?id?no:302。

147、在一些實施例中,工程化dsrna連接酶多肽包含在以下氨基酸殘基上不同于seqid?no:302的序列的氨基酸序列:x39、x218和x221;其中編號是指seq?id?no:302。在一些實施例中,工程化dsrna連接酶多肽包含含有以下氨基酸殘基的氨基酸序列:x39是a;x218是n;以及x221是i;其中編號是指seq?id?no:302。

148、在一些實施例中,工程化dsrna連接酶多肽包含在一個或多個(例如,兩個或更多個或者三個或更多個)選自以下的氨基酸殘基中不同于seq?id?no:302的序列的氨基酸序列:x39、x218、x221和x255;其中編號是指seq?id?no:302。在一些實施例中,工程化dsrna連接酶多肽包含含有一個或多個(例如,兩個或更多個或者三個或更多個)以下氨基酸殘基的氨基酸序列:x39是a;x218是n;x221是i;以及x255是c;其中編號是指seq?id?no:302。

149、在一些實施例中,工程化dsrna連接酶多肽包含在以下氨基酸殘基上不同于seqid?no:302的序列的氨基酸序列:x39、x218、x221和x255;其中編號是指seq?id?no:302。在一些實施例中,工程化dsrna連接酶多肽包含含有以下氨基酸殘基的氨基酸序列:x39是a;x218是n;x221是i;以及x255是c;其中編號是指seq?id?no:302。

150、在一些實施例中,工程化dsrna連接酶多肽包含在一個或多個(例如,兩個或更多個、三個或更多個、四個或更多個、五個或更多個、六個或更多個、或者七個或更多個)選自以下的氨基酸殘基中不同于seq?id?no:302的序列的氨基酸序列:x39、x53、x218、x221、x237、x251、x255和x285;其中編號是指seq?id?no:302。在一些實施例中,工程化dsrna連接酶多肽包含含有一個或多個(例如,兩個或更多個、三個或更多個、四個或更多個、五個或更多個、六個或更多個、或者七個或更多個)以下氨基酸殘基的氨基酸序列:x39是a;x?53是y;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a;其中編號是指seq?id?no:302。

151、在一些實施例中,工程化dsrna連接酶多肽包含在以下氨基酸殘基上不同于seqid?no:302的序列的氨基酸序列:x39、x53、x218、x221、x237、x251、x255和x285;其中編號是指seq?id?no:302。在一些實施例中,工程化dsrna連接酶多肽包含含有以下氨基酸殘基的氨基酸序列:x39是a;x?53是y;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a;其中編號是指seq?id?no:302。

152、在一些實施例中,工程化dsrna連接酶多肽包含在一個或多個(例如,兩個或更多個、三個或更多個、四個或更多個、五個或更多個、六個或更多個、七個或更多個、或者八個或更多個)選自以下的氨基酸殘基中不同于seq?id?no:302的序列的氨基酸序列:x15、x39、x53、x218、x221、x237、x251、x255和x285;其中編號是指seq?id?no:302。在一些實施例中,工程化dsrna連接酶多肽包含含有一個或多個(例如,兩個或更多個、三個或更多個、四個或更多個、五個或更多個、六個或更多個、七個或更多個、或者八個或更多個)以下氨基酸殘基的氨基酸序列:x15是d或e;x39是a;x?53是y;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a;其中編號是指seq?id?no:302。

153、在一些實施例中,工程化dsrna連接酶多肽包含在以下氨基酸殘基上不同于seqid?no:302的序列的氨基酸序列:x15、x39、x53、x218、x221、x237、x251、x255和x285;其中編號是指seq?id?no:302。在一些實施例中,工程化dsrna連接酶多肽包含含有以下氨基酸殘基的氨基酸序列:x15是d;x39是a;x?53是y;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a;其中編號是指seq?id?no:302。在一些實施例中,工程化dsrna連接酶多肽包含含有以下氨基酸殘基的氨基酸序列:x15是e;x39是a;x?53是y;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a;其中編號是指seq?id?no:302。

154、在一些實施例中,工程化dsrna連接酶多肽的氨基酸序列包含在一個或多個選自以下的氨基酸殘基中不同于seq?id?no:302的序列的氨基酸序列:x15、x39、x53、x185、x218、x221、x237、x251、x255和x285,其中編號是指seq?id?no:302,并且其中該工程化dsrna連接酶多肽具有dsrna連接酶活性;任選地,其中該工程化dsrna連接酶多肽的氨基酸序列包含以下氨基酸殘基中的一個或多個:x15是d;x39是a;x?53是y;x185是k;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a。

155、在一些實施例中,工程化dsrna連接酶多肽包含純化標簽。純化標簽典型地附加到多肽上,以便使用親和技術(shù)從其粗生物來源中純化它們。在一些實施例中,純化標簽包含多聚組氨酸標簽。多聚組氨酸標簽與含有固定金屬離子的基質(zhì)結(jié)合,并且可用于通過親和層析純化多肽。在一些實施例中,純化標簽進一步包含用于去除純化標簽的蛋白酶識別位點。在一些實施例中,蛋白酶識別位點包含煙草蝕紋病毒(tev)蛋白酶識別序列。在一些實施例中,純化標簽包含氨基酸序列mhhhhhhenlyfqs(seq?id?no:669)。

156、在一些實施例中,工程化dsrna連接酶多肽包含選自由以下組成的組的氨基酸序列:seq?id?no:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298和300。

157、在一些實施例中,工程化dsrna連接酶多肽包含選自由以下組成的組的氨基酸序列:seq?id?no:602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632和634。

158、在一些實施例中,工程化dsrna連接酶多肽包含選自由以下組成的組的氨基酸序列:seq?id?no:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632和634。

159、固定

160、本披露還提供了通過化學(xué)鍵或物理吸附方法固定在固體支持材料上的多肽,其中該多肽包含本文所披露的工程化dsrna連接酶多肽。

161、通過物理吸附固定多肽典型地涉及將多肽物理吸附或附接到固體支持材料上。吸附可以通過弱的非特異性力(例如范德華、疏水相互作用和氫鍵)發(fā)生。物理吸附可以通過將支持材料浸泡在多肽溶液中并溫育以允許物理吸附發(fā)生的時間來實現(xiàn)。通過化學(xué)鍵固定多肽典型地涉及通過共價鍵將多肽附接到支持材料。

162、在一些實施例中,dsrna連接酶多肽通過位于dsrna連接酶多肽和固體材料之間的間隔基固定。在一些實施例中,間隔基是肽(例如,包含2個或更多個、3個或更多個、4個或更多個、5個或更多個、10個或更多個、15個或更多個、20個或更多個、25個或更多個、30個或更多個、35個或更多個、40個或更多個、45個或更多個、50個或更多個、75個或更多個、或100個或更多氨基酸的肽)。

163、在一些實施例中,使用親和固定化來固定工程化dsrna連接酶多肽。在一些實施例中,工程化dsrna連接酶多肽使用金屬親和固定化來固定,例如通過將his標記的工程化dsrna連接酶多肽與固定金屬(例如鎳、鋅、鈷或銅)接觸。

164、在一些實施例中,固體支持材料包括膜、樹脂、固體載劑或其他固相材料。固體支持材料可以由有機聚合物組成,例如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚氧乙烯、聚甲基丙烯酸酯和聚丙烯酰胺及其共聚物和接枝物。固體支持材料還可以是無機的,例如玻璃、二氧化硅、可控多孔玻璃(cpg)、反相二氧化硅或金屬,如金或鉑。固體支持材料的構(gòu)型可以是珠、球、微粒、顆粒、凝膠、膜或表面的形式。表面可以是平面的、基本上平面的或非平面的。固體支持材料可以是多孔的或無孔的,并且可以具有溶脹或非溶脹特性。固體支持材料可以被構(gòu)型為孔、凹陷或其他容器、器皿、特征或位置的形式。可用于固定dsrna連接酶多肽以進行連接酶反應(yīng)的固體支持材料包括但不限于微珠或樹脂,例如聚甲基丙烯酸酯,如具有環(huán)氧官能團的聚甲基丙烯酸酯、具有氨基環(huán)氧官能團的聚甲基丙烯酸酯、聚甲基丙烯酸酯、苯乙烯/dvb共聚物或具有十八烷基官能團的聚甲基丙烯酸酯。

165、示例性固體支持物包括但不限于殼聚糖微珠、eupergit?c、ib-150、ib-350、ib-c435、ib-a369、ib-a161、ib-a171、ibs500、ib-s861、sepabeads(三菱公司(mitsubishi))(例如sepabeads?ec-ep、sepabeads?ec-hfa、sepabeads?ec-hg、sepabeads?ec-bu、sepabeads?ec-od、sepabeads?ec-cm、sepabeads?ec-ida、sepabeads?ec-ea、sepabeadsec-ha、sepabeads?ec-qa、sepabeads?exe、sepabeads?exa)、dilbeads-ta、amberzymeoxirane、amberlite?xad-7hp、amberlite?fpa98cl、amberlite?ira958cl、amberliteira67、amberlite?fpa90cl、amberlite?fpa40cl、amberlite?xad18、accurel?ep100、ecr8206f/5730、ecr8206/5803、ecr8206m/5749、relizyme?ep403、relizymeep113、lewatitvp?oc?1600、diaion?wa20、diaion?wa21j、diaion?wa30、dowex66、diaion?hpa-25l、lewatit?vp?oc?1064md?ph、lewatit?vp?oc?1163、lifetech?ecr8304f、lifetechecr8309f、lifetech?ecr8315f、lifetech?ecr8204f、lifetech?ecr8285、lifetechecr1090m、lifetech?ecr1030m、lifetech?ecr8806m、chromalite(mam2/f)d6591、chromalite?mida/m、chromalite?mida/m/fe、chromalite?mida/m/co、chromalite?mida/m/ni、chromalite?mida/m/cu和chromalite?mida/m/zn。

166、可用于生產(chǎn)工程化dsrna連接酶多肽的多核苷酸、控制序列、表達載體和宿主細胞

167、在另一方面,本披露提供了編碼具有本文所述的dsrna連接酶活性的工程化多肽的多核苷酸。多核苷酸可以與一個或多個控制基因表達的異源調(diào)控序列連接,以產(chǎn)生能夠表達工程化多肽的重組多核苷酸??梢詫幋a工程化dsrna連接酶的異源多核苷酸的表達構(gòu)建體引入至合適的宿主細胞中,以表達相應(yīng)的工程化dsrna連接酶多肽。

168、如本領(lǐng)域技術(shù)人員顯而易見的,蛋白質(zhì)序列的可用性和對應(yīng)于多種氨基酸的密碼子的知識提供了編碼感興趣的蛋白質(zhì)序列的所有可能的多核苷酸的說明。遺傳密碼的簡并性(其中相同的氨基酸由可選擇的或同義密碼子編碼)允許產(chǎn)生極大量的多核苷酸,所有這些多核苷酸都編碼本文所披露的工程化dsrna連接酶多肽。因此,在確定特定氨基酸序列后,本領(lǐng)域技術(shù)人員可以通過以不改變蛋白質(zhì)的氨基酸序列的方式修飾一個或多個密碼子來生成任意數(shù)量的不同多核苷酸。在此方面,本披露特別地考慮了對于本文所披露的任何多肽,通過選擇基于可能的密碼子選擇的組合對多核苷酸進行的每一種可能的改變,這些多肽包括實例7至12中列出的示例性工程化多肽的那些氨基酸序列、作為seq?id?no:304至600和636至668的偶數(shù)序列標識符披露的任何多肽、以及作為seq?id?no:4至300和602至634的偶數(shù)序列標識符披露的任何多肽。

169、在各種實施例中,優(yōu)選地選擇密碼子以適應(yīng)產(chǎn)生重組蛋白的宿主細胞。例如,優(yōu)選用于細菌的密碼子用于在細菌中表達基因;優(yōu)選用于酵母的密碼子用于在酵母中表達基因;以及優(yōu)選用于哺乳動物的密碼子用于在哺乳動物細胞中表達基因。

170、在一些實施例中,本披露提供了編碼上述工程化dsrna連接酶多肽的多核苷酸。

171、在一些實施例中,多核苷酸編碼包含與seq?id?no:304至600或636至668的偶數(shù)編號序列標識符的參比序列具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性的氨基酸序列的多肽,其中該多肽具有dsrna連接酶活性并且表現(xiàn)出的酶活性高于包含seq?id?no:2和/或302的氨基酸的多肽。

172、在一些實施例中,多核苷酸編碼本文所述的工程化dsrna連接酶多肽并且包含與選自具有seq?id?no:303至599或635至667的奇數(shù)編號序列標識符的序列的參比多核苷酸具有至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性的核酸序列,其中:(i)該多核苷酸不包含seq?id?no:301;以及(ii)該多核苷酸不編碼具有seq?id?no:302的氨基酸序列的dsrna連接酶多肽。

173、在一些實施例中,多核苷酸編碼本文所述的工程化dsrna連接酶多肽并且包含與選自具有seq?id?no:3至299或601至633的奇數(shù)編號序列標識符的序列的參比多核苷酸具有至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性的核酸序列,其中:(i)該多核苷酸不包含seq?id?no:1;以及(ii)該多核苷酸不編碼具有seq?id?no:2的氨基酸序列的dsrna連接酶多肽。容易理解的是,具有seq?id?no:3至299或601至633的奇數(shù)編號序列標識符的多核苷酸編碼包含n-末端純化標簽(seq?id?no:669)的工程化dsrna連接酶多肽。

174、可以多種方式對編碼工程化dsrna連接酶多肽的分離的多核苷酸進行操縱,以實現(xiàn)工程化多肽的表達,其中包括通過密碼子優(yōu)化進一步修飾序列以改善表達、在有或沒有另外的控制序列的情況下插入至合適的表達元件中,以及轉(zhuǎn)化至適合表達和生產(chǎn)工程化多肽的宿主細胞中。

175、根據(jù)表達載體,在將分離的多核苷酸插入載體之前對分離的多核苷酸進行操縱可能是期望的或必要的。使用重組dna方法修飾多核苷酸和核酸序列的技術(shù)是本領(lǐng)域熟知的。指南如下:sambrook等人,2001molecular?cloning:a?laboratory?manual[分子克隆:實驗室手冊],第三版,cold?spring?harbor?laboratory?press[冷泉港實驗室出版社];和current?protocols?in?molecular?biology[分子生物學(xué)實驗指南],ausubel.f.編輯,greene?pub.associates[格林出版協(xié)會有限公司],1998,2010年更新。

176、本披露還提供了包含本文所述的多核苷酸的表達載體。在一些實施例中,載體選自質(zhì)粒、黏粒、噬菌體或病毒載體。重組表達載體典型地包含一個或多個表達調(diào)節(jié)區(qū),例如啟動子和終止子、復(fù)制起點等。

177、編碼本文所述的工程化dsrna連接酶多肽的多核苷酸可通過將多核苷酸或包含多核苷酸序列的核酸構(gòu)建體插入適當?shù)谋磉_載體中來表達。在生成表達載體時,編碼序列位于載體中,使得編碼序列與合適的表達控制序列連接。重組表達載體可以是可方便地用于重組dna程序并可導(dǎo)致多核苷酸序列表達的任何載體(例如,質(zhì)?;虿《?。載體的選擇將通常取決于載體與待引入載體的宿主細胞的相容性。載體可以是直鏈或閉合環(huán)狀質(zhì)粒。表達載體可以是自主復(fù)制載體,即作為染色體外實體存在的載體,其復(fù)制獨立于染色體復(fù)制,例如質(zhì)粒、染色體外元素、微小染色體或人工染色體。載體可以包含用于確保自復(fù)制的任何工具。可替代地,載體可以是如下載體:當被引入宿主細胞時其可整合到基因組中,并與其所整合的染色體一起復(fù)制。此外,可以使用單一載體或質(zhì)粒或兩個或更多個載體或質(zhì)粒(這些載體或質(zhì)粒共同包含待引入到宿主細胞的基因組中的總dna)。

178、許多可用于本披露的實施例的表達載體可商購獲得。示例性表達載體可以通過將編碼工程化dsrna連接酶多肽的多核苷酸插入質(zhì)粒pacyc-duet-1(諾瓦根公司(novagen))、pbr322載體(新英格蘭生物實驗室(new?england?biolabs))、puc19載體(新英格蘭生物實驗室)或pet?t7表達載體(諾瓦根公司)中來制備。

179、本披露還提供了能夠表達本文所述的工程化dsrna連接酶多肽的宿主細胞。在一些實施例中,宿主細胞包含本文所述的核酸分子或本文所述的載體。在一些實施例中,宿主細胞是大腸桿菌(escherichia?coli)。

180、在一些實施例中,編碼多肽的多核苷酸與用于在宿主細胞中表達多肽的一個或多個控制序列連接。用于表達由本披露的表達載體編碼的多肽的宿主細胞是本領(lǐng)域熟知的,包括但不限于細菌細胞,例如大腸桿菌、鏈霉菌屬和鼠傷寒沙門氏菌;真菌細胞(例如釀酒酵母或畢赤酵母);昆蟲細胞,例如果蠅s2和斜紋夜蛾sf9;動物細胞,例如cho、cos、bhk、293和bowes黑色素瘤細胞;和植物細胞。示例性宿主細胞是大腸桿菌bl21(de3)。宿主細胞可以是野生型的或者可以通過基因組編輯進行工程化。適用于上述宿主細胞的培養(yǎng)基和生長條件是本領(lǐng)域熟知的。

181、用于表達多肽的多核苷酸或載體可以通過本領(lǐng)域已知的多種方法引入細胞中。技術(shù)包括電穿孔、生物粒子轟擊、脂質(zhì)體介導(dǎo)的轉(zhuǎn)染、氯化鈣轉(zhuǎn)染和原生質(zhì)體融合等。將多核苷酸引入細胞的不同方法是本領(lǐng)域技術(shù)人員已知的。

182、宿主細胞可用于表達和分離本文所述的多肽。

183、生產(chǎn)工程化dsrna連接酶多肽的過程

184、工程化dsrna連接酶可以通過對編碼dsrna連接酶的多核苷酸進行誘變和/或定向進化來獲得。示例性定向進化技術(shù)可以在“biocatalysis?for?the?pharmaceuticalindustry:discovery,development,and?manufacturing”(制藥業(yè)用生物催化:發(fā)現(xiàn)、發(fā)展與生產(chǎn))(2009john?wiley&sons?asia(pte)ltd.(約翰韋利父子有限公司亞洲辦事處)isbn:978-0-470-82314-9)中找到。

185、當工程化多肽的序列已知時,可以根據(jù)已知的合成方法通過標準固相方法制備編碼多核苷酸。在一些實施例中,最多約100個堿基的片段可以單獨合成,然后連接(例如,通過酶或化學(xué)連接方法或聚合酶介導(dǎo)的方法)以形成任何期望的連續(xù)序列。例如,本披露的多核苷酸和寡核苷酸可以使用例如beaucage等人,1981,tet?lett[四面體快報]22:1859-69或matthes等人,1984,embo?j.[歐洲分子生物學(xué)學(xué)會雜志]3:801-05描述的經(jīng)典亞磷酰胺酸法通過化學(xué)合成來制備,如典型地在自動合成方法中所實踐的。根據(jù)亞磷酰胺酸法,寡核苷酸在例如dna自動合成儀中被合成、純化、退火、連接并克隆到合適的載體中。此外,基本上任何核酸都可從多種商業(yè)來源中的任何一種獲得。

186、本披露提供了制備工程化dsrna連接酶多肽的方法,該方法包括培養(yǎng)本文所述的宿主細胞并從培養(yǎng)物中獲得工程化dsrna連接酶多肽的步驟。在一些實施例中,制備多肽的方法進一步包括分離多肽。工程化多肽可以在合適的細胞中表達,并使用任何一種或多種眾所周知的蛋白質(zhì)純化技術(shù)從宿主細胞和/或培養(yǎng)基中分離(或回收),用于蛋白質(zhì)純化的技術(shù)包括溶菌酶處理、超聲處理、過濾、鹽析、超速離心和層析等。

187、本發(fā)明還提供了通過培養(yǎng)本文所述的宿主細胞或根據(jù)制備本文所述的工程化dsrna連接酶多肽的方法可獲得的工程化dsrna連接酶催化劑,其中所述工程化dsrna連接酶催化劑包含含有工程化dsrna連接酶多肽的細胞或培養(yǎng)液、或用其加工的物品,其中該物品是指從宿主細胞的培養(yǎng)物中獲得的提取物、通過從提取物中分離或純化工程化dsrna連接酶獲得的分離的產(chǎn)物或通過固定宿主細胞、其提取物或提取物的分離的產(chǎn)物獲得的固定的產(chǎn)物。

188、連接反應(yīng)

189、本披露提供了從兩個或更多個寡核苷酸片段產(chǎn)生寡核苷酸的方法,其中該方法包括使以下接觸:(i)兩個或更多個寡核苷酸片段;(ii)本文所披露的工程化dsrna連接酶多肽;(iii)atp來源;以及(iv)二價陽離子;以獲得寡核苷酸。

190、寡核苷酸產(chǎn)物和片段

191、本發(fā)明的方法通過連接兩個或更多個寡核苷酸片段來產(chǎn)生寡核苷酸。產(chǎn)生的寡核苷酸(本文也稱為“寡核苷酸產(chǎn)物”)是典型地包含最多100個核苷酸的核酸。應(yīng)理解,本文所述的寡核苷酸包含rna。還應(yīng)理解,本文所述的寡核苷酸包含雙鏈區(qū)域。

192、如本文所用,“寡核苷酸片段”是指可以與一個或多個另外的寡核苷酸片段連接以提供寡核苷酸產(chǎn)物的核酸。每個寡核苷酸片段對應(yīng)于寡核苷酸產(chǎn)物的一部分。

193、在一些實施例中,寡核苷酸是治療性寡核苷酸。在一些實施例中,治療性寡核苷酸是小干擾rna(sirna)或反義寡核苷酸(aso)。在一些實施例中,寡核苷酸是適體。

194、在一些實施例中,寡核苷酸包含突出端。在一些實施例中,寡核苷酸包含3’突出端。在一些實施例中,寡核苷酸包含5’突出端。在一些實施例中,突出端包含1、2、3、4、5、6、7或8個核苷酸。在一些實施例中,寡核苷酸包含鈍末端。在一些實施例中,寡核苷酸包含兩個鈍末端。

195、在一些實施例中,寡核苷酸的長度為最多20個核苷酸。在一些實施例中,寡核苷酸的長度為最多25、最多30、最多35、最多40、最多45、最多50、最多55、最多60、最多65、最多70、最多75、最多80、最多85、最多90、最多95或最多100個核苷酸。在一些實施例中,寡核苷酸的長度為最多60個核苷酸。

196、在一些實施例中,寡核苷酸的長度至少為20個核苷酸。在一些實施例中,寡核苷酸的長度至少為25、至少30、至少35、至少40、至少45、至少50、至少55、至少60、至少65、至少70、至少75、至少80、至少85、至少90、至少95或100個核苷酸。

197、在一些實施例中,寡核苷酸的長度為10-100個核苷酸。在一些實施例中,寡核苷酸的長度為10-80、10-70、10-60、10-50、10-40、10-30、10-25、15-80、15-70、15-60、15-50、15-40、15-30、或15-25個核苷酸。在一些實施例中,寡核苷酸的長度為15-25個核苷酸。

198、如本文所用,兩個或更多個寡核苷酸片段包含一個或多個3’寡核苷酸片段和一個或多個5’寡核苷酸片段,其中一個或多個3’寡核苷酸片段中的每一個均包含5’-磷酸基團并且一個或多個5’-磷酸基團中的每一個典型地包含具有3’-羥基基團的3’末端核糖核苷酸。

199、在一些實施例中,一個或多個寡核苷酸片段包含一個或多個錯配。在一些實施例中,一個或多個寡核苷酸片段包含突出端。在一些實施例中,一個或多個寡核苷酸片段包含3’突出端。在一些實施例中,一個或多個寡核苷酸片段包含5’突出端。在一些實施例中,一個或多個寡核苷酸片段包含3’突出端和5’突出端。在一些實施例中,突出端包含1、2、3、4、5、6、7或8個核苷酸。

200、在一些實施例中,兩個或更多個寡核苷酸片段包含具有突出端的第一個寡核苷酸片段,該突出端與第二個寡核苷酸片段的突出端互補。在一些實施例中,兩個或更多個寡核苷酸片段包含具有3’突出端和5’突出端的第一個寡核苷酸片段,其中該3’突出端與第二個寡核苷酸片段的5’突出端互補,并且該5’突出端與第三個寡核苷酸的3’突出端互補。

201、在一些實施例中,一個或多個寡核苷酸片段包含鈍末端。在一些實施例中,一個或多個寡核苷酸片段包含3’突出端和5’鈍末端。在一些實施例中,一個或多個寡核苷酸片段包含5’突出端和3’鈍末端。在一些實施例中,寡核苷酸片段5’末端包含3’突出端和5’鈍末端。在一些實施例中,寡核苷酸片段3’末端包含5’突出端和3’鈍末端。

202、在一些實施例中,兩個或更多個寡核苷酸片段包含兩個或更多個rna寡核苷酸片段。在一些實施例中,兩個或更多個rna寡核苷酸片段包含雙鏈rna(dsrna)寡核苷酸片段。

203、在一些實施例中,一個或多個寡核苷酸片段包含dna和rna。例如,寡核苷酸片段的一部分可以是雙鏈dna,而另一部分是雙鏈rna,形成dna-rna嵌合體。

204、在一些實施例中,一個或多個寡核苷酸片段包含一條或兩條鏈,其是rna、或rna、dna、lna、嗎啉代、una(解鎖核酸)、tna(蘇糖核酸)、gna(乙二醇核酸)和/或fana(氟-阿拉伯核酸)、經(jīng)修飾的rna等的混合物。作為非限制性實例,一條或兩條鏈可以是例如rna(除了一個或多個核苷酸被dna、lna、嗎啉代、una、tna、gna和/或fana替換之外)和/或經(jīng)修飾的rna(例如,本文所披露的或本領(lǐng)域已知的任何經(jīng)修飾的rna,例如2’修飾的rna,包括但不限于2’-f、2’-ome、2’-o-moe?rna等)。

205、在一些實施例中,兩個或更多個寡核苷酸片段的長度相同。在一些實施例中,兩個或更多個寡核苷酸片段的長度不同。在一些實施例中,兩個或更多個寡核苷酸片段中的每一個的長度為3-20個核苷酸。在一些實施例中,兩個或更多個寡核苷酸片段中的每一個的長度為4-16個核苷酸。在一些實施例中,兩個或更多個寡核苷酸片段中的每一個的長度為4-16、4-15、5-15、6-15、4-14、4-13、4-12、4-11、4-10、4-9、5-9、或6-9個核苷酸。

206、在一些實施例中,兩個或更多個寡核苷酸片段中的每一個的長度為至少3個核苷酸。在一些實施例中,兩個或更多個寡核苷酸片段中的每一個的長度為至少4個、至少5個、至少6個、至少7個、至少8個、至少9個、至少10個、至少11個、至少12個、長度至少13、至少14、或至少15個核苷酸。

207、在一些實施例中,兩個或更多個寡核苷酸片段包含3個或更多個、4個或更多個、5個或更多個、6個或更多個、7個或更多個、8個或更多個、9個或更多個、或者10個或更多個寡核苷酸片段。

208、在一些實施例中,需要一個或多個連接反應(yīng)來生成寡核苷酸產(chǎn)物。在一些實施例中,需要2個或更多個、3個或更多個、4個或更多個、5個或更多個、6個或更多個、7個或更多個、8個或更多個、9個或更多個、或者10個或更多個連接反應(yīng)來生成寡核苷酸產(chǎn)物。

209、在一些實施例中,一個或多個寡核苷酸片段和/或寡核苷酸包含化學(xué)修飾。在一些實施例中,一個或多個寡核苷酸片段和/或寡核苷酸包含至少一種經(jīng)修飾的主鏈修飾。在一些實施例中,一個或多個寡核苷酸片段和/或寡核苷酸包含至少一種經(jīng)修飾的核苷酸修飾。在一些實施例中,一個或多個寡核苷酸片段和/或寡核苷酸包含至少一種糖修飾(例如,在2’位置或4’位置處)。在一些實施例中,一個或多個寡核苷酸片段和/或寡核苷酸包含:(i)至少一種經(jīng)修飾的主鏈修飾;(ii)以及至少一種經(jīng)修飾的核苷酸修飾;和/或(iii)至少一種糖修飾。

210、在一些實施例中,一個或多個寡核苷酸片段和/或寡核苷酸包含選自由以下組成的組的修飾:2’-o-甲基(2’-ome)、2’-氟(2’-f)、2’-脫氧、2’-脫氧-2’-氟、2’-o-甲氧基乙基(2’-o-moe)、2’-o-氨基丙基(2’-o-ap)、2’-o-二甲基氨基乙基(2’-o-dmaoe)、2’-o-二甲基氨基丙基(2’-o-dmap)、2’-o-二甲基氨基乙基氧基乙基(2’-o-dmaeoe)、2’-o-n-甲基乙酰胺基(2’-o-nma)、鎖核酸(lna)、乙二醇核酸(gna)、酰胺基磷酸酯(例如酰胺基磷酸甲磺酰酯)、2’,3’-斷裂核苷酸模擬物、2’-f-阿拉伯核苷酸、脫堿基核苷酸、2’-氨基修飾的核苷酸、2’-烷基-修飾的核苷酸、嗎啉代核苷酸、乙烯基膦酸酯(例如5’乙烯基膦酸酯)和環(huán)丙基膦酸酯脫氧核糖核苷酸。在一些實施例中,一個或多個寡核苷酸片段和/或寡核苷酸包含選自由以下組成的組的2’-修飾:2’-ome、2’-f和2’-脫氧。

211、在一些實施例中,一個或多個寡核苷酸片段和/或寡核苷酸包含至少一個硫代磷酸酯或甲基膦酸酯核苷酸間鍵。在一些實施例中,寡核苷酸包含至少一個手性硫代磷酸酯鍵。

212、在一些實施例中,一個或多個寡核苷酸片段和/或寡核苷酸與至少一個配體綴合。配體可以以任何構(gòu)型(例如,3’-端、5’-端、非末端或組合)與有義鏈、反義鏈或兩條鏈綴合。

213、在一些實施例中,配體包含一個或多個n-乙酰半乳糖胺(galnac)衍生物。galnac是半乳糖的氨基糖衍生物,可用作寡核苷酸中的靶向配體,旨在用于靶向肝臟,在肝臟中與肝細胞上的去唾液酸糖蛋白受體結(jié)合。在一些實施例中,配體包含通過二價或三價支鏈載體綴合的一種或多種galnac衍生物。在一些實施例中,配體是肽或擬肽。

214、在一些實施例中,配體與有義鏈綴合。在一些實施例中,配體與有義鏈的3’末端綴合。在一些實施例中,配體與有義鏈的5’末端綴合。在一些實施例中,配體與有義鏈的非末端綴合。

215、在一些實施例中,配體與反義鏈綴合。在一些實施例中,配體與反義鏈的3’末端綴合。在一些實施例中,配體與反義鏈的非末端綴合。

216、在一些實施例中,寡核苷酸是一種rnai劑,其包含選自由2’-ome、2’-f、2’-脫氧、2’-脫氧-2’-氟和2’-o-moe組成的組的至少一個2’-修飾的核苷酸。在一些實施例中,寡核苷酸是rnai劑,其中有義鏈與一個或多個galnac配體綴合。在一些實施例中,一個或多個寡核苷酸片段包含選自由2’-ome、2’-f、2’-脫氧、2’-脫氧-2’-氟和2’-o-moe組成的組的至少一個2’-修飾的核苷酸。在一些實施例中,一個或多個寡核苷酸片段是dsrna,其中有義鏈與一個或多個galnac配體綴合。

217、在一些實施例中,方法使用至少1mm、至少2mm、至少3mm、至少4mm、至少5mm、至少6mm、至少7mm、至少8mm、至少9mm、或至少10mm的寡核苷酸片段濃度進行。在一些實施例中,方法使用至少1mm、至少2mm、至少3mm、至少4mm、至少5mm、至少6mm、至少7mm、至少8mm、至少9mm,或至少10mm的各寡核苷酸片段進行。在一些實施例中,方法使用等摩爾量的兩個或更多個寡核苷酸片段中的每一個進行。

218、在一些實施例中,方法產(chǎn)生至少15g寡核苷酸產(chǎn)物/升反應(yīng)混合物。在一些實施例中,方法產(chǎn)生至少16g、至少17g、至少18g、至少19g、至少20g、至少30g、至少40g、至少50g、至少60g、至少70g、至少80g、至少90、或至少100g寡核苷酸產(chǎn)物/升反應(yīng)混合物。

219、工程化dsrna連接酶多肽

220、方法使用本文所述的工程化dsrna連接酶進行。

221、在一些實施例中,方法使用約1g/l工程化dsrna連接酶多肽進行,任選地1.1g/l、1.15g/l、1.2g/l、1.25g/l、1.3g/l、1.35g/l、1.4g/l、1.45g/l、1.5g/l、1.55g/l、1.6g/l、1.65g/l、1.7g/l、1.75g/l、1.8g/l、1.85g/l、1.9g/l、1.95g/l、2g/l、2.1g/l、2.2g/l、2.3g/l、2.4g/l、2.5g/l、2.6g/l、2.7g/l、2.8g/l、2.9g/l、3g/l、3.25g/l、3.5g/l、3.75g/l、4g/l、4.5g/l或5g/l工程化dsrna連接酶多肽。

222、atp來源

223、dsrna連接酶的酶活性需要atp作為輔因子。每次連接反應(yīng)將一個atp分子轉(zhuǎn)化為amp。dsrna連接酶的催化機制和atp在核酸連接反應(yīng)中的作用如上所述。

224、在一些實施例中,atp的來源是atp。在一些實施例中,方法使用化學(xué)計量濃度的atp來進行。在一些實施例中,方法使用化學(xué)計量過量的atp來進行。技術(shù)人員可以基于寡核苷酸片段的濃度和產(chǎn)生寡核苷酸產(chǎn)物所需的連接反應(yīng)的數(shù)量,容易地確定給定連接所需的atp的化學(xué)計量濃度。

225、在一些實施例中,方法使用約0.5mm、約1mm、約2mm、約3mm、約4mm、約5mm、約6mm、約7mm、約8mm、約9mm、約10mm、約12mm、約14mm、約16mm、約18mm、約20mm、約22mm、約24mm、約26mm、約28mm或約30mm?atp和/或amp濃度進行。

226、在一些實施例中,atp來源是atp再生系統(tǒng)。在一些實施例中,atp再生系統(tǒng)包括:(a)多磷酸激酶(ppk);(b)多磷酸;以及(c)amp和/或atp。有利地,atp再生系統(tǒng)的使用克服了使用高濃度atp以實現(xiàn)完全連接的要求。本文所述atp再生系統(tǒng)包含ppk和多磷酸。ppk使用多磷酸作為磷酸供體從amp生成atp。在連接反應(yīng)期間轉(zhuǎn)化為amp的atp可以通過ppk再生為atp,并在后續(xù)連接反應(yīng)中用作輔因子。這種atp循環(huán)避免了在起始反應(yīng)中使用高atp濃度的需求。相反,可以使用亞化學(xué)計量濃度的atp和/或使用更便宜的替代物amp進行反應(yīng)。

227、“多磷酸激酶”或“ppk”是催化從amp和多磷酸形成atp的酶家族。

228、在一些實施例中,ppk是ppk12。在一些實施例中,ppk包含與seq?id?no:670(ppk12的氨基酸序列)具有至少70%序列同一性的氨基酸序列。在一些實施例中,ppk包含與seqid?no:670具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列同一性的氨基酸序列。

229、在一些實施例中,ppk包含與seq?id?no:671(優(yōu)化的ppk12的氨基酸序列)具有至少70%序列同一性的氨基酸序列。在一些實施例中,ppk包含與seq?id?no:671具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列同一性的氨基酸序列。

230、在一些實施例中,ppk是約氏不動桿菌多磷酸:amp磷酸轉(zhuǎn)移酶(ajpap)(uniprotid:q83xd3)。在一些實施例中,ppk包含與seq?id?no:672(ajpap的氨基酸序列)具有至少70%序列同一性的氨基酸序列。在一些實施例中,ppk包含與seq?id?no:672具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列同一性的氨基酸序列。

231、在一些實施例中,ppk以全細胞、粗提物(例如,無細胞凍干提取物或細胞裂解物)、分離的多肽或純化的多肽的形式使用。在一些實施例中,ppk多肽以如本文所述的固定形式使用,例如固定在樹脂上。

232、在一些實施例中,方法使用約1g/l?ppk進行,任選地1.1g/l、1.15g/l、1.2g/l、1.25g/l、1.3g/l、1.35g/l、1.4g/l、1.45g/l、1.5g/l、1.55g/l、1.6g/l、1.65g/l、1.7g/l、1.75g/l、1.8g/l、1.85g/l、1.9g/l、1.95g/l、2g/l、2.1g/l、2.2g/l、2.3g/l、2.4g/l、2.5g/l、2.6g/l、2.7g/l、2.8g/l、2.9g/l、3g/l、3.25g/l、3.5g/l、3.75g/l、4g/l、4.5g/l或5g/lppk。

233、在一些實施例中,多磷酸是多磷酸鹽。在一些實施例中,多磷酸鹽是多磷酸鈉(馬德雷爾鹽)或六偏磷酸鈉(格蘭漢姆鹽)。

234、在一些實施例中,方法使用化學(xué)計量過量的多磷酸來進行。在一些實施例中,方法使用至少5mm、至少10mm、至少15mm、至少20mm、至少25mm、至少30mm、至少35mm、至少40mm、至少45mm、至少50mm、55mm、至少60mm、至少65mm、至少70mm、至少75mm、至少80mm、至少85mm、至少90mm、至少95mm、或至少100mm多磷酸濃度進行。

235、在一些實施例中,其中方法在ppk和多磷酸的存在下進行,方法在amp的存在下進行。在一些實施例中,其中方法在ppk和多磷酸的存在下進行,方法使用亞化學(xué)計量濃度的atp和/或amp進行。

236、二價陽離子

237、dsrna連接酶的酶活性要求存在二價陽離子。ppk的酶活性要求存在二價陽離子。在一些實施例中,二價陽離子包含mg2+和/或mn2+。

238、在一些實施例中,方法使用5-100mm、10-100mm、15-100mm、20-100mm、30-100mm、5-90mm、5-80mm、5-70mm、5-60mm、5-50mm或30-50mm二價陽離子濃度進行。在一些實施例中,方法使用至少5mm、至少10mm、至少15mm、至少20mm、至少25mm、至少30mm、至少35mm、至少40mm、至少45mm、至少50mm、55mm、至少60mm、至少65mm、至少70mm、至少75mm、至少80mm、至少85mm、至少90mm、至少95mm、或至少100mm二價陽離子濃度進行。

239、在一些實施例中,方法進一步包括從反應(yīng)混合物中純化寡核苷酸產(chǎn)物。在一些實施例中,寡核苷酸產(chǎn)物為至少80%純,任選地其中寡核苷酸產(chǎn)物為至少85%、至少90%、至少95%純,任選地其中寡核苷酸產(chǎn)物為至少98%純,任選地其中寡核苷酸產(chǎn)物為至少99%純,任選地其中寡核苷酸產(chǎn)物為至少99.5%純,任選地其中寡核苷酸產(chǎn)物為至少99.9%純。純的寡核苷酸產(chǎn)物不包含寡核苷酸片段、中間體連接產(chǎn)物或非特異性連接產(chǎn)生的副產(chǎn)物。寡核苷酸產(chǎn)物可以使用本領(lǐng)域已知的任何方法純化或分離,例如使用凝膠提取或使用纖維素基基質(zhì)。

240、本披露還提供了通過本文所述的方法產(chǎn)生的寡核苷酸。寡核苷酸可以在任何合適的緩沖液中。在一些實施例中,緩沖液選自tris緩沖液(例如tris-hcl)、磷酸鹽緩沖液、hepes、mops(3-(n-嗎啉代)丙磺酸)和三乙醇胺(teoa)緩沖液。在一些實施例中,緩沖液包含乙酸鹽、檸檬酸鹽、醇溶蛋白、碳酸鹽或磷酸鹽、或其任何組合。在一些實施例中,緩沖液進一步包含用于控制溶液滲透壓的試劑,使得滲透壓保持在期望值,例如人血漿的生理值。可以添加至緩沖液中以控制滲透壓的溶質(zhì)包括但不限于蛋白質(zhì)、肽、氨基酸、非代謝聚合物、維生素、離子、糖、代謝物、有機酸、脂質(zhì)或鹽。在一些實施例中,用于控制溶液的滲透壓的試劑是鹽。在一些實施例中,用于控制溶液的滲透壓的試劑是氯化鈉或氯化鉀。

241、反應(yīng)條件

242、如本文所披露的并在實例中舉例說明的,本披露考慮了一系列可在本文所述方法中使用的合適反應(yīng)條件,包括但不限于ph、溫度、緩沖液、底物負載、酶負載、輔因子負載、壓力和反應(yīng)時間。用于本文所述的連接反應(yīng)的另外的合適反應(yīng)條件可以容易地通過常規(guī)實驗進行優(yōu)化,例如,在不同試劑濃度、ph、溫度的實驗反應(yīng)條件下執(zhí)行本文所述的方法,并檢測寡核苷酸產(chǎn)物形成的速率。

243、在本文所披露的過程的任何實施例中,反應(yīng)條件可包括合適的ph。如上所述,可通過使用酸或堿、合適的緩沖液或緩沖液與添加的酸或堿的組合來維持期望的ph或期望的ph范圍??梢栽诜磻?yīng)之前和/或反應(yīng)期間控制反應(yīng)混合物的ph。在一些實施例中,合適的反應(yīng)條件包括約4至約8的溶液ph、約5至約8的ph、約6至約8的ph或約7至約8的ph。在一些實施例中,反應(yīng)條件包括約4、4.5、5、5.5、6、6.5、7、7.5或8的溶液ph。

244、在本文所披露的方法的任何實施例中,可以將合適的溫度用于反應(yīng)條件,考慮例如在較高溫度下反應(yīng)速率的增加、足夠的反應(yīng)持續(xù)時間內(nèi)酶的活性。因此,在一些實施例中,合適的反應(yīng)條件包括約10℃至約60℃、約10℃至約50℃、約25℃至約50℃、約25℃至約40℃、約25℃至約30℃、或約10℃至約30℃的溫度。在一些實施例中,合適的反應(yīng)溫度包括約10℃、15℃、20℃、25℃、30℃、35℃、40℃、45℃、50℃、55℃或60℃的溫度。在一些實施例中,酶促反應(yīng)期間的溫度可在整個反應(yīng)過程中保持在一定溫度。在一些實施例中,酶促反應(yīng)期間的溫度可在反應(yīng)過程中以一定溫度譜調(diào)節(jié)。

245、反應(yīng)可在任何合適的緩沖溶液中進行。在一些實施例中,緩沖液選自tris緩沖液(例如tris-hcl)、磷酸鹽緩沖液、hepes、mops(3-(n-嗎啉代)丙磺酸)和三乙醇胺(teoa)緩沖液。在一些實施例中,緩沖液包含乙酸鹽、檸檬酸鹽、醇溶蛋白、碳酸鹽或磷酸鹽、或其任何組合。在一些實施例中,緩沖液是磷酸鹽緩沖鹽水(pbs)。

246、在一些實施例中,反應(yīng)混合物進一步包含還原劑,任選地dtt(二硫蘇糖醇)。

247、在進行本文所述的連接反應(yīng)時,可以將工程化dsrna連接酶多肽以不同的配制劑形式添加到反應(yīng)混合物中,如用編碼工程化dsrna連接酶多肽的基因轉(zhuǎn)化的冷凍或凍干全細胞(fwc或lwc)和/或如這樣的細胞的細胞裂解物或凍干細胞裂解物,即所謂的搖瓶粉末(sfp),其中細胞碎片被去除和/或進一步純化成發(fā)酵粉末(fp)。用編碼工程化dsrna連接酶多肽的基因轉(zhuǎn)化的全細胞或其細胞提取物、裂解物和分離的酶可以多種不同的形式使用,包括固體(例如,凍干的、噴霧干燥的等)或半固體(例如,粗糊劑)。細胞提取物或細胞裂解物可以在凍干之前通過沉淀(例如,硫酸銨、聚乙烯亞胺、熱處理等)、隨后進行脫鹽程序(例如,超濾、透析等)來部分純化。任何酶制劑都可以固定到固相材料(例如樹脂)上。

248、在本文所披露的過程的任何實施例中,其中工程化多肽以分泌型多肽的形式表達,含有分泌型多肽的培養(yǎng)基可用于本文的過程中。

249、在本文所披露的過程的任何實施例中,固體反應(yīng)物(例如,酶、鹽等)可以多種不同的形式提供給反應(yīng),包括粉末(例如,凍干的、噴霧干燥的等)、溶液、乳液、懸浮液等。使用本領(lǐng)域技術(shù)人員已知的方法和儀器可以容易地將反應(yīng)物凍干或噴霧干燥。例如,可以將蛋白質(zhì)溶液以小等分試樣在-80℃下冷凍,然后添加到預(yù)冷凍干室中,然后施加真空。

250、在本文所披露的過程的任何實施例中,反應(yīng)物的添加順序并不關(guān)鍵。反應(yīng)物可以同時一起添加到溶劑中,或者可替代地,一些反應(yīng)物可以單獨添加,并且一些反應(yīng)物可以在不同時間點一起添加。

251、進行連接反應(yīng)的方法可以包括分離酶促反應(yīng)的寡核苷酸產(chǎn)物的進一步步驟。特別地,這一步驟典型地在酶促反應(yīng)完成后進行。特別地,將寡核苷酸典型地與反應(yīng)混合物的一種或多種(特別是基本上所有)其他組分分離。例如,將寡核苷酸典型地與剩余的底物、副產(chǎn)物和/或酶分離。寡核苷酸的分離可以通過本領(lǐng)域已知的手段和技術(shù)來實現(xiàn),例如,通過基于寡核苷酸的大小進行分離,如通過凝膠電泳和凝膠提取或使用纖維素基基質(zhì)。在一些實施例中,方法進一步包括通過超濾和層析純化寡核苷酸。

252、修飾

253、在一些實施例中,寡核苷酸片段和/或寡核苷酸包含修飾,例如化學(xué)修飾。如本文所用,術(shù)語“寡核苷酸片段”意指一個或多個寡核苷酸片段。應(yīng)理解,寡核苷酸片段中存在的修飾典型地存在于由所述寡核苷酸片段產(chǎn)生的寡核苷酸中。在一些實施例中,向寡核苷酸產(chǎn)物中引入修飾和/或從寡核苷酸產(chǎn)物中去除修飾。

254、在一些實施例中,寡核苷酸片段和/或寡核苷酸包含化學(xué)修飾。在一些實施例中,寡核苷酸片段和/或寡核苷酸包含至少一種主鏈修飾。在一些實施例中,寡核苷酸片段和/或寡核苷酸包含至少一種核苷酸修飾。在一些實施例中,寡核苷酸片段和/或寡核苷酸包含至少一種糖修飾(例如,在2’-位置或4’-位置處)。在一些實施例中,寡核苷酸片段和/或寡核苷酸包含:(i)至少一種主鏈修飾;(ii)至少一種核苷酸修飾;和/或(iii)至少一種糖修飾。

255、修飾包括但不限于末端寡核苷酸片段的末端修飾,例如,5’-末端修飾(磷酸化、綴合、倒置鍵)或3’-末端修飾(綴合、倒置鍵等);堿基修飾,例如用穩(wěn)定堿基、不穩(wěn)定堿基或與擴展的伴侶庫堿基配對的堿基替換、去除堿基(脫堿基核苷酸)或綴合的堿基;糖修飾(例如,在2’-位置或4’-位置處)或糖替換;或主鏈修飾,包括磷酸二酯鍵的修飾或替換。

256、在一些實施例中,末端寡核苷酸片段和/或寡核苷酸包含帽。術(shù)語“帽”等包括附接到雙鏈核苷酸雙鏈體末端的化學(xué)部分,但在本文中用于排除作為核苷酸或核苷的化學(xué)部分?!?’帽”附接在核苷酸或寡核苷酸的3’末端并且保護分子免于被例如核酸酶(如血清或腸液中的那些)降解。非核苷酸3’帽不是核苷酸,并且可以替換鈍末端寡核苷酸末端的tt或uu二核苷酸。在一些實施例中,非核苷酸3’末端帽是如例如以下中所披露的:wo?2005/021749和wo?2007/128477;和美國專利號8,097,716;美國專利號8,084,600;和美國專利號8,344,128。“5’帽”附接在核苷酸或寡核苷酸的5’末端。帽不應(yīng)干擾(或過度干擾)寡核苷酸活性。

257、在一些實施例中,寡核苷酸片段和/或寡核苷酸包含一個或多個錯配。錯配在本文中定義為當將兩個序列最大限度地比對和比較時堿基序列或長度之間的差異。在雙鏈寡核苷酸(其中兩個序列是彼此反平行比對的)的背景下,錯配定義為一個序列的堿基與另一個序列的堿基不互補的位置。因此,例如當?shù)谝粋€和第二個序列彼此反平行比對時,如果第一個序列中的某個位置有一個特定堿基(例如,a),并且第二個序列中的相應(yīng)位置的堿基與第一個序列中的所述堿基不互補(例如,g),則算作錯配。但要注意的是,在給定的rna鏈上,u可以被t(作為rna或優(yōu)選地dna,例如2’-脫氧胸苷)替換;用t替換u并不是如本文所用的錯配,因為u或t都可以與相反鏈上的a配對。因此,rna寡核苷酸可以包含一個或多個dna堿基,例如t。如果發(fā)生堿基配對,則rnai劑的dna部分與相應(yīng)的靶mrna之間不算作錯配(例如,在dna部分中的a、g、c或t與mrna中相應(yīng)的u、c、g或a之間)。

258、例如,如果一個序列中的某個位置有堿基(例如,a),而另一個序列中的相應(yīng)位置沒有堿基(例如,那個位置是脫堿基核苷酸,其包含磷酸-糖主鏈,但沒有堿基),則也算作錯配。任一序列(或有義鏈或反義鏈)中的單鏈切口不算作錯配。因此,作為非限制性實例,如果一個序列(處于5’→3’方向)包含序列ag,但互補序列(處于3’→5’方向)包含在t和c之間具有單鏈切口的序列tc,則不算作錯配。糖或磷酸中的核苷酸修飾也不被視為錯配。因此,如果一個序列包含g,并且互補序列在同一位置包含經(jīng)修飾的c(例如,2’-修飾),則不算作錯配。

259、因此,如果對寡核苷酸的糖、磷酸或主鏈進行修飾而不修飾堿基,則不算作錯配。因此,在雙鏈rnai的背景下,具有給定序列的作為rna的鏈與其作為pna;或嗎啉代;或lna;或tna;或gna;或fana;或rna與dna、tna、gna、fana、嗎啉代、una、lna和/或pna等的混合或嵌合體的互補序列之間有零個錯配。在t核苷酸與具有5’修飾和/或2’修飾的a核苷酸之間不會出現(xiàn)錯配。錯配(堿基替換)的主要特征是其不能與相反鏈上的相應(yīng)堿基進行堿基配對。此外,在計算錯配數(shù)時,“uu”或“dtdt”等末端突出端不計算在內(nèi)。在這種情況下,錯配定義為一個序列的堿基與另一個序列的堿基不匹配的位置。

260、應(yīng)指出的是,dtdt(2’-脫氧-胸苷-5’-磷酸和2’-脫氧-胸苷-5’-磷酸),或在某些情況下,tt或uu,可作為末端二核苷酸帽或延伸物添加到寡核苷酸的一個或兩個3’-端,但這種帽或延伸物不包括在錯配總數(shù)的計算中,并且不被視為靶序列的一部分。這是因為末端二核苷酸可以保護末端不被核酸酶降解,但對靶特異性沒有貢獻(elbashir等人2001nature[自然]411:494-498;elbashir等人2001embo?j.[歐洲分子生物學(xué)學(xué)會雜志]20:6877-6888;和kraynack等人2006rna?12:163-176)。

261、本領(lǐng)域中有多個實例描述了可以被引入核酸分子中并顯著增強其核酸酶穩(wěn)定性和效力的糖、堿基、磷酸和主鏈修飾。例如,通過用核酸酶抗性基團(例如,2’-氨基、2’-c-烯丙基、2’-氟、2’-o-甲基、2’-o-烯丙基、2’-h、核苷酸堿基修飾)來修飾寡核苷酸,以增強穩(wěn)定性和/或增強生物活性。本領(lǐng)域中廣泛描述了核酸分子的糖修飾。

262、對寡核苷酸的另外的修飾和綴合也有描述。soutschek等人2004nature[自然]432:173-178提出了通過吡咯烷接頭將膽固醇與sirna分子有義鏈的3’-端綴合,從而生成共價且不可逆的綴合物。還可以對寡核苷酸進行化學(xué)修飾(包括與其他分子綴合),以改善其體內(nèi)藥代動力學(xué)保留時間和效率。

263、在一些實施例中,寡核苷酸片段和/或寡核苷酸包含經(jīng)修飾的堿基。本披露涵蓋一種寡核苷酸和寡核苷酸片段,其給定位置上的單核苷酸被相同核苷酸的經(jīng)修飾的版本所取代。因此,核苷酸(a、g、c或u)可以被選自以下的經(jīng)修飾的堿基所替換:5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黃嘌呤、黃嘌呤、4-乙酰胞嘧啶、5-(羧基羥甲基)尿嘧啶、5-羧甲基氨基甲基-2-硫代尿苷、5-羧甲基氨基甲基尿嘧啶、二氫尿嘧啶、β-d-半乳糖基奎苷、肌苷、n6-異戊烯基腺嘌呤、1-甲基鳥嘌呤、1-甲基肌苷、2,2-二甲基鳥嘌呤、2-甲基腺嘌呤、2-甲基鳥嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、n6-腺嘌呤、7-甲基鳥嘌呤、5-甲基氨基甲基尿嘧啶、5-甲氧基氨基甲基-2-硫脲嘧啶、β-d-甘露糖基奎苷、5’-甲氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-n6-異戊烯基腺嘌呤、尿嘧啶-5-氧乙酸(v)、懷丁氧苷(wybutoxosine)、假尿嘧啶、奎苷(queosine)、2-巰基胞嘧啶、5-甲基-2-硫脲嘧啶、2-硫脲嘧啶、4-硫脲嘧啶、5-甲基脲嘧啶、尿嘧啶-5-氧乙酸甲酯、尿嘧啶-5-氧乙酸(v)、5-甲基-2-硫脲嘧啶、3-(3-氨基-3-n-2-羧丙基)尿嘧啶、2,6-二氨基嘌呤、5-羥甲基胞嘧啶、2-氨基腺嘌呤、腺嘌呤和鳥嘌呤的6-甲基和其他烷基衍生物、腺嘌呤和鳥嘌呤的2-丙基和其他烷基衍生物、2-硫代胸腺嘧啶、5-丙炔基(—c═c—ch3)尿嘧啶和胞嘧啶以及嘧啶堿基的其他炔基衍生物、6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶、8-鹵代、8-氨基、8-硫醇、8-硫代烷基、8-羥基和其他8-取代的腺嘌呤和鳥嘌呤、5-鹵代特別是5-溴、5-三氟甲基和其他5-取代的尿嘧啶和胞嘧啶、7-甲基腺嘌呤、2-f-腺嘌呤、8-氮雜鳥嘌呤和8-氮雜腺嘌呤、7-脫氮鳥嘌呤和7-脫氮腺嘌呤以及3-脫氮鳥嘌呤和3-脫氮腺嘌呤。

264、另外的經(jīng)修飾的變體包括向寡核苷酸或寡核苷酸片段添加任何其他部分(例如,放射性標記或其他標簽或綴合物);如果堿基序列相同,添加其他部分就會產(chǎn)生“經(jīng)修飾的變體”(無錯配)。

265、除了這些修飾和用于修飾的模式(例如,形式)之外,還可以使用核酸修飾的常識來生成所提供的序列的其他修飾或修飾集。這些不同的實施例和本披露的寡核苷酸的實施例可以用于rna干擾。

266、在一些實施例中,寡核苷酸和/或寡核苷酸片段包含使得該寡核苷酸在生物樣品或環(huán)境(例如,細胞質(zhì)、間質(zhì)液、血清、肺或腸灌洗液)中具有增加的穩(wěn)定性的修飾。

267、在一些實施例中,寡核苷酸和/或寡核苷酸片段包含促進通過rna誘導(dǎo)沉默復(fù)合物切割的修飾(即“risc切割位點”)。risc切割位點是靶標上發(fā)生切割的位點。在一些實施例中,反義鏈包含risc切割位點。對于具有長度為17-23個核苷酸的雙鏈體區(qū)域的rnai劑,反義鏈的切割位點典型地位于距5’-端10、11和12位置附近。如本文所用,術(shù)語“切割區(qū)域”是指緊鄰切割位點的區(qū)域。在一些實施例中,切割區(qū)域包含位于切割位點任一末端并緊鄰切割位點的三個堿基。在一些實施例中,切割區(qū)域包含位于切割位點任一末端并緊鄰切割位點的兩個堿基。在一些實施例中,切割位點特別地出現(xiàn)在反義鏈的核苷酸10和11結(jié)合的位點處,并且切割區(qū)域包含反義鏈的核苷酸11、12和13。

268、在一些實施例中,寡核苷酸片段和/或寡核苷酸包含經(jīng)修飾的主鏈。如本文所用,未經(jīng)修飾的主鏈由3’至5’磷酸二酯鍵組成。經(jīng)修飾的主鏈可以包含非天然核苷間鍵。具有經(jīng)修飾的主鏈的寡核苷酸包括在主鏈中保留磷原子的那些和在主鏈中不具有磷原子的那些。

269、包含經(jīng)修飾的主鏈的寡核苷酸片段包括但不限于在主鏈中不具有磷原子的那些。經(jīng)修飾的主鏈包括但不限于硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基膦酸酯(例如,3’-亞烷基膦酸酯和手性膦酸酯)、次膦酸酯、酰胺基磷酸酯(例如,酰胺基磷酸甲磺酰酯、3’-氨基酰胺基磷酸酯和氨基烷基酰胺基磷酸酯)、硫代酰胺基磷酸酯、硫代烷基膦酸酯、硫代烷基磷酸三酯和具有正常3’-5’鍵的硼烷磷酸酯、這些的2’-5’連接類似物以及具有倒置極性的那些,其中相鄰的核苷單元對是3’-5’至5’-3’或2’-5’至5’-2’連接的。

270、包含其中不含有磷原子的經(jīng)修飾的主鏈的寡核苷酸片段可能具有由短鏈烷基或環(huán)烷基核苷間鍵、混合的雜原子和烷基或環(huán)烷基核苷間鍵或一個或多個短鏈雜原子或雜環(huán)核苷間鍵形成的主鏈。這些包括具有嗎啉代鍵(部分由核苷的糖部分形成);硅氧烷主鏈;硫化物、亞砜和砜主鏈;甲乙?;?formacetyl)和硫代甲乙?;麈?;亞甲基甲乙?;?formacetyl)和硫代甲乙?;麈?;含有烯烴的主鏈;氨基磺酸鹽主鏈;亞甲基亞氨基和亞甲基肼基主鏈;磺酸酯和磺酰胺主鏈;酰胺主鏈;和其他具有混合的n、o、s和ch2組成部分的那些。

271、在一些實施例中,寡核苷酸和/或寡核苷酸片段包含至少一個膦酸酯鍵,其中該膦酸酯是選自由以下組成的組的經(jīng)修飾的膦酸酯:硫代磷酸酯(可以是rp異構(gòu)體或sp異構(gòu)體):

272、

273、二硫代磷酸酯:

274、

275、甲基膦酸酯:

276、

277、甲氧基丙基膦酸酯:

278、

279、5’-(e)-乙烯基膦酸酯:

280、

281、5’-甲基膦酸酯:

282、

283、(s)-5’-c-甲基與膦酸酯:

284、

285、5’-硫代磷酸酯;

286、

287、和肽核酸:

288、

289、在一些實施例中,寡核苷酸和/或寡核苷酸片段包含:至少一個5’-尿苷-腺嘌呤-3’(5’-ua-3’)二核苷酸,其中該尿苷是2’-修飾的核苷酸;至少一個5’-尿苷-鳥嘌呤-3’(5’-ug-3’)二核苷酸,其中該5’-尿苷是2’-修飾的核苷酸;至少一個5’-胞苷-腺嘌呤-3’(5’-ca-3’)二核苷酸,其中該5’-胞苷是2’-修飾的核苷酸;或至少一個5’-尿苷-尿苷-3’(5’-uu-3’)二核苷酸,其中該5’-尿苷是2’-修飾的核苷酸。這些二核苷酸基序特別容易被血清核酸酶降解(例如rnase?a)?;蛑械谝粋€嘧啶核苷酸的2’-位置處的化學(xué)修飾可防止或減緩這樣的切割。這種修飾方案也以術(shù)語“endo?light”已知。

290、在一些實施例中,寡核苷酸和/或寡核苷酸片段包含經(jīng)修飾的核堿基,其中該經(jīng)修飾的核堿基是二氟甲苯基、硝基吲哚基、硝基吡咯基或硝基咪唑基。在特定的實施例中,經(jīng)修飾的核堿基是二氟甲苯基。在一些實施例中,其中寡核苷酸和/或寡核苷酸片段是雙鏈的,兩條鏈中僅一條含有經(jīng)修飾的核堿基。在一些實施例中,其中寡核苷酸和/或寡核苷酸片段是雙鏈的,兩條鏈均含有經(jīng)修飾的核堿基。

291、在一些實施例中,寡核苷酸片段和/或寡核苷酸包含經(jīng)修飾的糖。糖修飾典型地涉及rna或dna的糖部分的化學(xué)修飾。糖修飾包括但不限于2’位置處的以下之一:oh;f;o-、s-或n-烷基;o-、s-或n-烯基;o-、s-或n-炔基;或o-烷基-o-烷基,其中該烷基、烯基和炔基可以是取代或未取代的c1至c10烷基或c2至c10烯基和炔基。示例性修飾包括o[(ch2)no]mch3、o(ch2)noch3、o(ch2)nnh2、o(ch2)nch3、o(ch2)nonh2和o(ch2)non[(ch2)nch3]2,其中n和m為1至約10。本文所述方法中使用的寡核苷酸片段可以在2’位置處包含以下之一:c1至c10低級烷基、取代的低級烷基、烷芳基、芳烷基、o-烷芳基或o-芳烷基、sh、sch3、ocn、cl、br、cn、cf3、ocf3、soch3、so2ch3、ono2、no2、n3、nh2、雜環(huán)烷基、雜環(huán)烷芳基、氨基烷基氨基、聚烷基氨基、取代的甲硅烷基、rna切割基團、報告基團、嵌入劑、用于改善治療性rna的藥代動力學(xué)特性的基團、或用于改善治療性rna的藥效學(xué)特性的基團。在一些實施例中,修飾包含2’-甲氧基乙氧基(也稱為2’-o-(2-甲氧基乙基)或2’-o-moe)、2’-二甲基氨基氧基乙氧基(也稱為2’-dmaoe)和2’-二甲基氨基乙氧基乙氧基(在本領(lǐng)域中也稱為2’-o-二甲基氨基乙氧基乙基或2’-dmaeoe)。進一步的示例性修飾包括:5’-me-2’-f核苷酸、5’-me-2’-ome核苷酸、5’-me-2’-脫氧核苷酸、2’-烷氧基烷基;和2’-nma(n-甲基乙酰胺)。

292、其他修飾包括2’-甲氧基(2’-och3)、2’-氨基丙氧基(2’-och2ch2ch2nh2)和2’-氟(2’-f)。類似的修飾也可以在rna上的其他位置進行,特別是3’末端核苷酸或2’-5’連接的dsrna上糖的3’位置以及5’末端核苷酸的5’位置。

293、在一些實施例中,寡核苷酸片段和/或寡核苷酸包含至少一種經(jīng)修飾的核苷酸。在一些實施例中,修飾選自由以下組成的組:2’-o-甲基(2’-ome)、2’-氟(2’-f)、2’-脫氧、2’-脫氧-2’-氟、2’-o-甲氧基乙基(2’-o-moe)、2’-o-氨基丙基(2’-o-ap)、2’-o-二甲基氨基乙基(2’-o-dmaoe)、2’-o-二甲基氨基丙基(2’-o-dmap)、2’-o-二甲基氨基乙基氧基乙基(2’-o-dmaeoe)、2’-o-n-甲基乙酰胺基(2’-o-nma)、鎖核酸(lna)、乙二醇核酸(gna)、酰胺基磷酸酯(例如酰胺基磷酸甲磺酰酯)、2’,3’-斷裂核苷酸模擬物、2’-f-阿拉伯核苷酸、脫堿基核苷酸、2’-氨基修飾的核苷酸、2’-烷基-修飾的核苷酸、嗎啉代核苷酸、乙烯基膦酸酯(例如5’乙烯基膦酸酯)和環(huán)丙基膦酸酯脫氧核糖核苷酸。在一些實施例中,一個或多個寡核苷酸片段包含選自由以下組成的組的2’-修飾:2’-ome、2’-f和2’-脫氧。在一些實施例中,寡核苷酸和/或寡核苷酸片段包含一個或多個3’-o-甲基核苷酸。

294、在一些實施例中,寡核苷酸和/或寡核苷酸片段包含選自由以下組成的組的2’-修飾:2’-o-甲基(2’-ome)、2’-氟(2’-f)、2’-脫氧、2’-脫氧-2’-氟、2’-o-甲氧基乙基(2’-o-moe)、2’-o-氨基丙基(2’-o-ap)、2’-o-二甲基氨基乙基(2’-o-dmaoe)、2’-o-二甲基氨基丙基(2’-o-dmap)、2’-o-二甲基氨基乙基氧基乙基(2’-o-dmaeoe)、2’-o-n-甲基乙酰胺基(2’-o-nma)、鎖核酸(lna)、酰胺基磷酸酯(例如酰胺基磷酸甲磺酰酯)、2’,3’-斷裂核苷酸模擬物、2’-f-阿拉伯核苷酸、脫堿基核苷酸、2’-氨基修飾的核苷酸、2’-烷基-修飾的核苷酸、嗎啉代核苷酸、乙烯基膦酸酯(例如5’乙烯基膦酸酯)、脫氧核糖核苷酸和環(huán)丙基膦酸酯。在一些實施例中,寡核苷酸和/或寡核苷酸片段包含一個或多個3’-o-甲基核苷酸。

295、在一些實施例中,寡核苷酸和/或寡核苷酸片段包含橋接核酸。在一些實施例中,橋接核酸是鎖核酸。在一些實施例中,橋接核酸是受約束的乙基橋接核酸:

296、

297、在一些實施例中,所有嘧啶(尿苷和胞苷)都是2’o-甲基-修飾的核苷。

298、在一些實施例中,有義鏈和/或反義鏈與一種或多種診斷性化合物、報告基團、交聯(lián)劑、核酸酶抗性賦予部分、經(jīng)修飾或未經(jīng)修飾的核堿基、親脂性分子、膽固醇、脂質(zhì)、凝集素、類固醇、烏蘇醇(uvaol)、龍舌蘭皂苷配基、薯蕷皂苷配基、萜、三萜、薩灑皂苷配基(sarsasapogenin)、無羈萜、表無羈萜醇衍生的石膽酸、維生素、碳水化合物、右旋糖酐、出芽短梗霉聚糖、幾丁質(zhì)、殼聚糖、合成碳水化合物、低聚乳酸15-mer、天然聚合物、低分子量或中等分子量聚合物、菊糖、環(huán)糊精、透明質(zhì)酸、蛋白質(zhì)、蛋白質(zhì)結(jié)合劑、整合蛋白靶向分子、聚陽離子、肽、聚胺、肽模擬物和/或轉(zhuǎn)鐵蛋白綴合。

299、在一些實施例中,反義鏈包含至少一個2’-ome修飾的核苷酸。在一些實施例中,反義鏈包含至少一個2’-f修飾的核苷酸。在一些實施例中,反義鏈包含至少一個2’-脫氧修飾的核苷酸。在一些實施例中,反義鏈包含至少一個2’-ome修飾的核苷酸、至少一個2’-f修飾的核苷酸、或至少一個2’-脫氧修飾的核苷酸或其任何組合。在一些實施例中,反義鏈包含交替的2’-ome和2’-f修飾的核苷酸。在一些實施例中,反義鏈包含至少一個5’乙烯基膦酸酯。在一些實施例中,反義鏈包含至少一個手性硫代磷酸酯。在一些實施例中,反義鏈包含至少一個gna。在一些實施例中,有義鏈包含至少一個2’-ome修飾的核苷酸。在一些實施例中,有義鏈包含至少一個2’-f修飾的核苷酸。在一些實施例中,有義鏈包含至少一個2’-脫氧修飾的核苷酸。在一些實施例中,有義鏈包含至少一個2’-ome修飾的核苷酸、至少一個2’-f修飾的核苷酸、或至少一個2’-脫氧修飾的核苷酸或其任何組合。在一些實施例中,有義鏈包含交替的2’-ome和2’-f修飾的核苷酸。在一些實施例中,反義鏈和有義鏈各自包含至少一個2’-ome修飾的核苷酸。在一些實施例中,反義鏈和有義鏈各自包含至少一個2’-f修飾的核苷酸。在一些實施例中,反義鏈和有義鏈各自包含交替的2’-ome和2’-f修飾的核苷酸。在一些實施例中,有義鏈包含至少一個5’乙烯基膦酸酯。在一些實施例中,有義鏈包含至少一個手性硫代磷酸酯鍵。在一些實施例中,有義鏈包含至少一個gna。

300、在一些實施例中,有義鏈在有義鏈的全長上包含交替的2’-ome和2’-f修飾的核苷酸。在一些實施例中,有義鏈在有義鏈的部分長度(例如,有義鏈的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個或更多個核苷酸)上包含交替的2’-ome和2’-f修飾的核苷酸。

301、在一些實施例中,反義鏈在反義鏈的全長上包含交替的2’-ome和2’-f修飾的核苷酸。在一些實施例中,反義鏈在反義鏈的部分長度(例如,反義鏈的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個或更多個核苷酸)上包含交替的2’-ome和2’-f修飾的核苷酸。

302、在一些實施例中,有義鏈和反義鏈在有義鏈和反義鏈的全長上各自包含交替的2’-ome和2’-f修飾的核苷酸。在一些實施例中,有義鏈和反義鏈在有義鏈和反義鏈的部分長度(例如,有義鏈和反義鏈的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個或更多個核苷酸)上包含交替的2’-ome和2’-f修飾的核苷酸。

303、配體

304、在一些實施例中,一個或多個寡核苷酸片段與至少一個配體綴合。在一些實施例中,寡核苷酸產(chǎn)物與至少一個配體綴合。配體可以以任何構(gòu)型(例如,3’-端、5’-端、非末端或組合)與有義鏈、反義鏈或兩條鏈綴合。

305、在一些實施例中,配體包含一個或多個n-乙酰半乳糖胺(galnac)衍生物。在一些實施例中,配體包含通過二價或三價支鏈載體綴合的一種或多種galnac衍生物。

306、在一些實施例中,配體是:

307、

308、在一些實施例中,配體是:

309、

310、在一些實施例中,配體是:

311、

312、在一些實施例中,配體是:

313、

314、在一些實施例中,配體是:

315、

316、在一些實施例中,配體是:

317、

318、在一些實施例中,配體改變其摻入的分子的分布、靶向或壽命。在一些實施例中,例如與不存在這樣的配體的物質(zhì)相比,配體對所選靶標,例如分子、細胞或細胞類型、隔室、受體,如細胞或器官隔室、組織、器官或身體區(qū)域提供增強的親和力。對所選靶標提供增強的親和力的配體也稱為靶向配體。

319、一些配體可具有內(nèi)體溶解(endosomolytic)特性。內(nèi)體溶解配體促進內(nèi)體的溶解和/或寡核苷酸或包含寡核苷酸的組合物從內(nèi)體到細胞的細胞質(zhì)的轉(zhuǎn)運。內(nèi)體溶解配體可以是顯示出ph依賴性膜活性和融合性的聚陰離子肽或擬肽。在一些實施例中,內(nèi)體溶解配體在內(nèi)體ph下呈現(xiàn)其活性構(gòu)象。“活性”構(gòu)象是內(nèi)體溶解配體促進內(nèi)體的溶解和/或寡核苷酸或包含寡核苷酸的組合物從內(nèi)體到細胞的細胞質(zhì)的轉(zhuǎn)運的構(gòu)象。示例性內(nèi)體溶解配體包括gala肽(subbarao等人,biochemistry[生化雜志],1987,26:2964-2972)、eala肽(vogel等人,j.am.chem.soc.[美國化學(xué)會志],1996,118:1581-1586)及其衍生物(turk等人,biochem.biophys.acta[生物化學(xué)與生物物理學(xué)報],2002,1559:56-68)。內(nèi)體溶解組分可含有化學(xué)基團(例如,氨基酸),其將響應(yīng)于ph的變化而經(jīng)歷電荷變化或質(zhì)子化。內(nèi)體溶解組分可以是直鏈或支鏈的。

320、配體可以改善轉(zhuǎn)運、雜交和特異性特性,并且還可以改善所得天然或經(jīng)修飾的寡核苷酸的核酸酶抗性。

321、配體通??砂ㄖ委熜揎梽缬糜谠鰪姅z??;診斷化合物或報告基團,例如用于監(jiān)測分布;交聯(lián)劑;和核酸酶抗性賦予部分。一般實例包括脂質(zhì)、類固醇、維生素、糖、蛋白質(zhì)、肽、聚胺和肽模擬物。

322、配體可包括天然存在的物質(zhì),如蛋白質(zhì)(例如,人血清白蛋白(hsa)、低密度脂蛋白(ldl)、高密度脂蛋白(hdl)或球蛋白);碳水化合物(例如,右旋糖酐、出芽短梗霉聚糖、幾丁質(zhì)、殼聚糖、菊糖、環(huán)糊精或透明質(zhì)酸);或脂質(zhì)。配體還可以是重組或合成分子,如合成聚合物(例如,合成聚氨基酸)、寡核苷酸(例如,適體)。聚氨基酸的實例包括聚賴氨酸(pll)、聚l-天冬氨酸、聚l-谷氨酸、苯乙烯-馬來酸酐共聚物、聚(l-丙交酯-co-乙交酯)共聚物、二乙烯基醚-馬來酸酐共聚物、n-(2-羥丙基)甲基丙烯酰胺共聚物(hmpa)、聚乙二醇(peg)、聚乙烯醇(pva)、聚氨酯、聚(2-乙基丙烯酸)、n-異丙基丙烯酰胺聚合物或聚磷嗪。聚胺的實例包括:聚乙烯亞胺、聚賴氨酸(pll)、精胺、亞精胺、聚胺、假肽-聚胺、擬肽聚胺、樹枝狀聚胺、精氨酸、脒、魚精蛋白、陽離子脂質(zhì)、陽離子卟啉、聚胺的季鹽或α螺旋肽。

323、配體還可以包括與指定的細胞類型結(jié)合的靶向基團,例如細胞或組織靶向劑,如凝集素、糖蛋白、脂質(zhì)或蛋白質(zhì)(如抗體)。靶向基團可以是促甲狀腺激素、促黑激素、凝集素、糖蛋白、表面活性劑蛋白a、粘蛋白碳水化合物、多價乳糖、多價半乳糖、n-乙酰基-半乳糖胺、n-乙酰基-葡萄糖胺多價甘露糖、多價巖藻糖、糖基化聚氨基酸、多價半乳糖、轉(zhuǎn)鐵蛋白、二膦酸酯、聚谷氨酸鹽、聚天冬氨酸鹽、脂質(zhì)、膽固醇、類固醇、膽汁酸、葉酸、維生素b12、生物素、rgd肽、rgd擬肽或適體。

324、配體的其他實例包括染料、嵌入劑(例如吖啶)、交聯(lián)劑(例如,補骨脂素、絲裂霉素c)、卟啉(tppc4、德克薩斯卟啉(texaphyrin)、噻啉(sapphyrin))、多環(huán)芳烴(例如,吩嗪、二氫吩嗪)、人工內(nèi)切酶或螯合劑(例如edta)、親脂性分子(例如,膽固醇、膽酸、金剛烷乙酸、1-芘丁酸、二氫睪酮、1,3-雙-o(十六烷基)甘油、香葉氧基己基基團、十六烷基甘油、冰片、薄荷醇、1,3-丙二醇、十七烷基基團、棕櫚酸、肉豆蔻酸、o3-(油酰)石膽酸、o3-(油酰)膽烯酸、二甲氧基三苯甲基或吩噁嗪)和肽綴合物(例如,黑腹果蠅觸足(antennapedia)肽、tat肽)、烷化劑、磷酸鹽、氨基、巰基、peg(例如peg-40k)、mpeg、[mpeg]2、聚氨基、烷基、取代的烷基、放射性標記的標記物、酶、半抗原(例如生物素)、轉(zhuǎn)運/吸收促進劑(例如,阿司匹林、維生素e、葉酸)、合成核糖核酸酶(例如,咪唑、雙咪唑、組胺、咪唑簇、吖啶-咪唑綴合物、四氮雜大環(huán)的eu3+復(fù)合物)、二硝基苯基、hrp或ap。

325、配體可以是蛋白質(zhì),例如糖蛋白或肽,如對輔配體具有特異性親和力的分子,或抗體,如結(jié)合指定的細胞類型(如癌細胞、內(nèi)皮細胞或骨細胞)的抗體。配體還可以包括激素和激素受體。它們還可以包括非肽物質(zhì),例如脂質(zhì)、凝集素、碳水化合物、維生素、輔因子、多價乳糖、多價半乳糖、n-乙?;?半乳糖胺、n-乙?;?葡萄糖胺多價甘露糖、多價巖藻糖或適體。配體可以是例如脂多糖、p38?map激酶的激活劑或nf-κb的激活劑。

326、在一些實施例中,配體是脂質(zhì)或基于脂質(zhì)的分子。這樣的脂質(zhì)或基于脂質(zhì)的分子優(yōu)選地結(jié)合血清蛋白,例如人血清白蛋白(hsa)。hsa結(jié)合配體允許綴合物分布至靶組織。脂質(zhì)或基于脂質(zhì)的配體可以(a)增加對綴合物降解的抗性,(b)增加靶向或轉(zhuǎn)運至靶細胞或細胞膜中,和/或(c)可用于調(diào)節(jié)與血清蛋白(例如hsa)的結(jié)合?;谥|(zhì)的配體可用于調(diào)節(jié),例如控制綴合物與靶組織的結(jié)合。

327、在一些實施例中,配體是肽或擬肽。擬肽是能夠折疊成類似于天然肽的確定的三維結(jié)構(gòu)的分子。肽或擬肽部分可為約5-50個氨基酸長,例如約5、10、15、20、25、30、35、40、45或50個氨基酸長。肽或擬肽可以是例如細胞滲透肽、陽離子肽、兩親性肽或疏水性肽(例如,主要由tyr、trp或phe組成)。肽部分可以是樹枝狀肽、受約束的肽或交聯(lián)肽。在另一個替代方案中,肽部分可以包含疏水性膜轉(zhuǎn)位序列(mts)。肽部分可以是“遞送”肽,其可以攜帶大的極性分子,包括肽、寡核苷酸和蛋白質(zhì)穿過細胞膜。肽或擬肽可以由dna的隨機序列編碼,例如從噬菌體展示文庫或一珠一化合物(one-bead-one-compound(oboc))組合文庫(lam等人,nature[自然],354:82-84,1991)中鑒定的肽。

328、如本文所用,“肽部分”的長度范圍可為約5個氨基酸至約50個氨基酸。肽部分可以具有結(jié)構(gòu)修飾,例如以增加穩(wěn)定性或直接構(gòu)象特性??梢岳萌缦滤龅娜魏谓Y(jié)構(gòu)修飾。精氨酸-甘氨酸-天冬氨酸(rgd)-肽部分可用于靶向腫瘤細胞,例如內(nèi)皮腫瘤細胞或乳腺癌腫瘤細胞(zitzmann等人,cancer?res.[癌癥研究],62:5139-43,2002)。rgd肽可以促進寡核苷酸靶向多種其他組織(包括肺、腎臟、脾臟或肝臟)的腫瘤(aoki等人,cancer?genetherapy[癌基因治療]8:783-787,2001)。rgd肽可以是線性的或環(huán)狀的,并且可以被修飾,例如糖基化或甲基化,以促進靶向特定組織??梢允褂冒邢蛟鲋臣毎懈患臉擞浳锏碾?。例如,含有rgd的肽和擬肽可以靶向癌細胞,特別是表現(xiàn)出整合蛋白的細胞。因此,配體可以包含rgd肽、含有rgd的環(huán)肽、含有d-氨基酸的rgd肽、或合成的rgd模擬物。

329、肽和擬肽配體包括具有天然存在的或經(jīng)修飾的肽,例如d或l肽;α、β或γ肽;n-甲基肽;氮雜肽;具有一個或多個酰胺(即肽)鍵被一個或多個脲、硫脲、氨基甲酸酯或磺酰脲鍵取代的肽;或環(huán)肽的那些。

330、配體可以在多個位置(例如,3’-端、5’-端和/或在內(nèi)部(“非末端”)位置)處與寡核苷酸片段和/或寡核苷酸偶聯(lián)。在一些實施例中,配體通過居間系鏈(intervening?tether)(例如本文所述的載體)連接。當單體摻入寡核苷酸片段和/或寡核苷酸中時,配體或栓系的配體可以存在于單體上。在一些實施例中,配體可以在“前體”單體已摻入寡核苷酸片段和/或寡核苷酸后通過與“前體”單體偶聯(lián)來摻入。例如,具有例如氨基封端的系鏈(即,沒有相關(guān)配體)的單體(例如tap-(ch2)nnh2)可以摻入生長的寡核苷酸片段中。在后續(xù)的操作中,即在將前體單體摻入寡核苷酸片段中之后,通過將配體的親電基團與前體單體系鏈的末端親核基團偶聯(lián),可以將具有親電基團(例如五氟苯酯或醛基基團)的配體隨后附接到前體單體。

331、在另一個實例中,可以摻入具有適合參與點擊化學(xué)反應(yīng)的化學(xué)基團(例如疊氮化物或炔烴封端的系鏈/接頭)的單體。在后續(xù)的操作中,即在將前體單體摻入寡核苷酸片段和/或寡核苷酸中之后,通過將炔烴與疊氮化物偶聯(lián)在一起,可以將具有互補化學(xué)基團(例如炔烴或疊氮化物)的配體附接到前體單體。

332、在一些實施例中,配體與寡核苷酸片段和/或寡核苷酸的核堿基、糖部分或核苷間鍵綴合。與嘌呤核堿基或其衍生物的綴合可以發(fā)生在任何位置,包括環(huán)內(nèi)和環(huán)外原子。在一些實施例中,嘌呤核堿基的2-、6-、7-或8-位置附接到綴合部分。與嘧啶核堿基或其衍生物的綴合也可以發(fā)生在任何位置。在一些實施例中,嘧啶核堿基的2-、5-和6-位置可以被綴合部分取代。與核苷的糖部分的綴合可以發(fā)生在任何碳原子處??筛浇拥骄Y合部分的糖部分的示例碳原子包括2’、3’和5’碳原子。1’位置也可以附接到綴合部分,例如在脫堿基殘基中。核苷間鍵也可以攜帶綴合部分。對于含磷鍵(例如,磷酸二酯、硫代磷酸酯(如手性硫代磷酸酯)、二硫代磷酸酯、酰胺基磷酸酯等),綴合部分可以直接附接到磷原子或附接到與磷原子結(jié)合的o、n或s原子。對于含胺或酰胺的核苷間鍵(例如,pna),綴合部分可以附接到胺或酰胺的氮原子或附接到相鄰的碳原子。

333、在一些實施例中,配體與有義鏈綴合。在一些實施例中,配體與有義鏈的3’末端綴合。在一些實施例中,配體與有義鏈的5’末端綴合。在一些實施例中,配體與有義鏈的非末端綴合。

334、在一些實施例中,配體與反義鏈綴合。在一些實施例中,配體與反義鏈的3’末端綴合。在一些實施例中,配體與反義鏈的非末端綴合。

335、配體可以通過載體附接。載體包括(i)至少一個“主鏈附接點”,優(yōu)選地兩個“主鏈附接點”和(ii)至少一個“栓系附接點”。如本文所用,“主鏈附接點”是指官能團,例如羥基基團,或通??捎糜谇疫m用于將載體摻入核酸主鏈(例如,磷酸或經(jīng)修飾的磷酸(如含硫)主鏈)中的鍵。在一些實施例中,“栓系附接點”(tap)是指連接所選部分的環(huán)狀載體的組成環(huán)原子,例如碳原子或雜原子(不同于提供主鏈附接點的原子)。部分可以是例如碳水化合物,如單糖、二糖、三糖、四糖、寡糖和多糖。任選地,所選部分通過居間系鏈連接至環(huán)狀載體。因此,環(huán)狀載體通常包含官能團,例如氨基基團,或通常提供適用于將另一種化學(xué)實體(例如配體)摻入或栓系至組成環(huán)的鍵。

336、其中,寡核苷酸片段是dsrna,有義鏈和/或反義鏈可以通過載體與配體綴合,其中該載體可以是環(huán)狀基團或無環(huán)基團;優(yōu)選地,環(huán)狀基團選自吡咯烷基、吡唑啉基、吡唑烷基、咪唑啉基、咪唑烷基、哌啶基、哌嗪基、[1,3]二氧戊環(huán)、噁唑烷基、異噁唑烷基、嗎啉基、噻唑烷基、異噻唑烷基、喹喔啉基、噠嗪基、四氫呋喃基和萘烷;優(yōu)選地,無環(huán)基團選自絲氨醇主鏈或二乙醇胺主鏈。

337、在一些實施例中,一個或多個寡核苷酸片段包含序列“tt”、“dtdt”、“dtsdt”或“uu”,作為3’末端的單鏈突出端,本文中也稱為末端二核苷酸或3’末端二核苷酸。dt是2’-脫氧-胸苷-5’-磷酸,并且sdt是2’-脫氧胸苷5’-硫代磷酸酯。末端二核苷酸“uu”是uu或2’-ome-u?2’-ome-u,并且末端tt和末端uu可以處于倒置/反向方向。末端二核苷酸(例如,uu)是二胸苷二核苷酸的經(jīng)修飾的變體,通常作為突出端放置,以保護sirna的末端免受核酸酶的影響(參見例如elbashir等人2001nature[自然]411:494-498;elbashir等人2001emboj.[歐洲分子生物學(xué)學(xué)會雜志]20:6877-6888;和kraynack等人2006rna?12:163-176)。從這些參考文獻中可知,末端二核苷酸可增強核酸酶抗性,但無助于靶標識別。

338、在一些實施例中,一個或兩個末端寡核苷酸片段包含3’末端帽代替末端二核苷酸或除了末端二核苷酸之外還包含3’末端帽,以穩(wěn)定末端免于核酸酶降解,前提是3’末端帽能夠穩(wěn)定寡核苷酸(例如,對抗核酸酶),并且不會過度干擾其期望的活性。

339、其中,寡核苷酸片段是dsrna,有義鏈和/或反義鏈可以通過載體與配體綴合,其中該載體可以是環(huán)狀基團或無環(huán)基團;優(yōu)選地,環(huán)狀基團選自吡咯烷基、吡唑啉基、吡唑烷基、咪唑啉基、咪唑烷基、哌啶基、哌嗪基、[1,3]二氧戊環(huán)、噁唑烷基、異噁唑烷基、嗎啉基、噻唑烷基、異噻唑烷基、喹喔啉基、噠嗪基、四氫呋喃基和萘烷;優(yōu)選地,無環(huán)基團選自絲氨醇主鏈或二乙醇胺主鏈。

340、其他實施例

341、實施例1.一種工程化雙鏈rna(dsrna)連接酶多肽,該多肽包含與選自由以下組成的組的氨基酸序列具有至少80%序列同一性的氨基酸序列:seq?id?no:304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598和600;

342、其中工程化dsrna連接酶多肽:

343、(a)具有dsrna連接酶活性;并且

344、(b)不包含seq?id?no:302的氨基酸序列。

345、實施例2.一種工程化雙鏈rna(dsrna)連接酶多肽,該多肽包含與選自由以下組成的組的氨基酸序列具有至少80%序列同一性的氨基酸序列:seq?id?no:304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666和668;

346、其中工程化dsrna連接酶多肽:

347、(a)具有dsrna連接酶活性;并且

348、(b)不包含seq?id?no:302的氨基酸序列。

349、實施例3.如實施例1所述的工程化dsrna連接酶多肽,其中該多肽包含選自由以下組成的組的氨基酸序列:seq?id?no:370、488、526、578、588、590和592。

350、實施例4.如實施例2所述的工程化dsrna連接酶多肽,其中該多肽包含選自由以下組成的組的氨基酸序列:seq?id?no:370、488、526、578、588、590、592和666。

351、實施例5.一種工程化dsrna連接酶多肽,該多肽包含與seq?id?no:302具有至少80%序列同一性的氨基酸序列,其在相同的連接反應(yīng)條件下比包含seq?id?no:302的氨基酸序列的dsrna連接酶多肽多產(chǎn)生至少5%的寡核苷酸產(chǎn)物,其中該工程化dsrna連接酶多肽不包含seq?id?no:302的氨基酸序列。

352、實施例6.如實施例5所述的工程化dsrna連接酶多肽,其中該連接反應(yīng)條件包括約1μm至約10mm寡核苷酸片段、atp來源、約5mm至約100mm二價陽離子和約0.5g/l至約10g/l工程化dsrna連接酶多肽、約4.0至約8.0的ph和約10℃至約50℃的溫度。

353、實施例7.如實施例5或6所述的工程化dsrna連接酶多肽,其中該工程化dsrna連接酶多肽的氨基酸序列包含在一個或多個選自以下的氨基酸殘基中不同于seq?id?no:302的序列的氨基酸序列:x6、x7、x15、x19、x29、x36、x39、x46、x47、x49、x51、x53、x56、x57、x60、x63、x64、x66、x67、x87、x88、x91、x93、x103、x105、x107、x114、x122、x126、x129、x130、x131、x137、x144、x146、x158、x163、x173、x178、x190、x196、x216、x218、x221、x228、x230、x232、x235、x236、x237、x238、x239、x242、x243、x244、x251、x252、x254、x255、x258、x269、x280、x284、x285、x293、x296、x301、x303、x305、x314、x325和x328,其中編號是指seq?id?no:302。

354、實施例8.如實施例7所述的工程化dsrna連接酶多肽,其中該工程化dsrna連接酶多肽的氨基酸序列包含以下氨基酸殘基中的一個或多個:x6是g;x7是q;x15是r、d或e;x19是q或d;x29是n或l;x36是v;x39是a;x46是y;x47是e;x49是g;x51是l;x53是y;x56是r或a;x57是s;x60是t、g或p;x63是s、q或g;x64是r、t、q、f、g或m;x66是f或w;x67是n;x87是t、p、k或不存在;x88是c;x91是s;x93是g、c或a;x103是v、c、y或t;x105是v;x107是r或t;x114是n;x122是w;x126是g;x129是n;x130是r、s或y;x131是r;x137是v或c;x144是n;x146是r;x158是w;x163是g;x173是l;x178是r;x190是q;x196是s或c;x216是l或r;x218是n;x221是i;x228是r;x230是t;x232是r;x235是a、t或g;x236是s、l或f;x237是s、q或r;x238是f;x239是g或r;x242是r或m;x243是n、s、g或m;x244是g或k;x251是d或l;x252是v;x254是k;x255是c;x258是v;x269是l;x280是w;x284是a;x285是a;x293是r;x296是r;x301是g、l、e或f;x303是q;x305是g;x314是a或v;x325是r;以及x328是r;其中編號是指seq?id?no:302。

355、實施例9.如實施例5-8中任一個所述的工程化dsrna連接酶多肽,其中該工程化dsrna連接酶多肽的氨基酸序列包含在一個或多個選自以下的氨基酸殘基中不同于seq?idno:302的序列的氨基酸序列:x6、x7、x15、x19、x29、x36、x39、x44、x45、x46、x47、x49、x51、x53、x56、x57、x60、x63、x64、x66、x67、x87、x88、x89、x91、x92、x93、x103、x105、x107、x114、x122、x126、x129、x130、x131、x137、x144、x146、x158、x163、x173、x178、x185、x190、x196、x216、x218、x221、x228、x230、x232、x235、x236、x237、x238、x239、x242、x243、x244、x251、x252、x254、x255、x258、x269、x280、x284、x285、x293、x296、x301、x303、x305、x313、x314、x325和x328,其中編號是指seq?id?no:302。

356、實施例10.如實施例9所述的工程化dsrna連接酶多肽,其中該工程化dsrna連接酶多肽的氨基酸序列包含以下氨基酸殘基中的一個或多個:x6是g或e;x7是q;x15是r、d或e;x19是q或d;x29是n或l;x36是v;x39是a;x44是v;x45是v;x46是y;x47是e;x49是g;x51是l;x53是y;x56是r或a;x57是s;x60是t、g或p;x63是s、q或g;x64是r、t、q、f、g或m;x66是f或w;x67是n;x87是t、p、k或不存在;x88是c;x89是t;x91是s;x92是d;x93是g、c或a;x103是v、c、y或t;x105是v;x107是r或t;x114是n;x122是w;x126是g;x129是n;x130是r、s或y;x131是r;x137是v或c;x144是n;x146是r;x158是w;x163是g;x173是l;x178是r;x185是k;x190是q;x196是s或c;x216是l或r;x218是n;x221是i;x228是r;x230是t;x232是r;x235是a、t或g;x236是s、l或f;x237是s、q、r、l或g;x238是f;x239是g或r;x242是r或m;x243是n、s、g或m;x244是g或k;x251是d或l;x252是v;x254是k;x255是c;x258是v;x269是l;x280是w;x284是a;x285是a;x293是r;x296是r;x301是g、l、e或f;x303是q;x305是g;x313是a;x314是a或v;x325是r;以及x328是r;其中編號是指seq?id?no:302。

357、實施例11.如實施例5-10中任一個所述的工程化dsrna連接酶多肽,其中該工程化dsrna連接酶多肽的氨基酸序列包含在一個或多個選自以下的氨基酸殘基中不同于seq?idno:302的序列的氨基酸序列:x15、x19、x36、x39、x53、x218、x221、x237、x251、x255和x285,其中編號是指seq?id?no:302,并且其中該工程化dsrna連接酶多肽具有dsrna連接酶活性。

358、實施例12.如實施例11所述的工程化dsrna連接酶多肽,其中該工程化dsrna連接酶多肽的氨基酸序列包含以下氨基酸殘基中的一個或多個:x15是d或e;x19是d;x36是v;x39是a;x53是y;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a;其中編號是指seq?id?no:302。

359、實施例13.如實施例5-12中任一個所述的工程化dsrna連接酶多肽,其中該工程化dsrna連接酶多肽的氨基酸序列包含在一個或多個選自以下的氨基酸殘基中不同于seq?idno:302的序列的氨基酸序列:x15、x19、x36、x39、x53、x185、x218、x221、x237、x251、x255和x285,其中編號是指seq?id?no:302,并且其中該工程化dsrna連接酶多肽具有dsrna連接酶活性。

360、實施例14.如實施例13所述的工程化dsrna連接酶多肽,其中該工程化dsrna連接酶多肽的氨基酸序列包含以下氨基酸殘基中的一個或多個:x15是d或e;x19是d;x36是v;x39是a;x53是y;x185是k;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a;其中編號是指seq?id?no:302。

361、實施例15.如實施例5-14中任一個所述的工程化dsrna連接酶多肽,其中該工程化dsrna連接酶多肽的氨基酸序列包含在一個或多個選自以下的氨基酸殘基中不同于seq?idno:302的序列的氨基酸序列:x36、x39、x218和x221,其中編號是指seq?id?no:302,并且其中該工程化dsrna連接酶多肽具有dsrna連接酶活性;任選地,其中該工程化dsrna連接酶多肽的氨基酸序列包含以下氨基酸殘基中的一個或多個:x36是v;x39是a;x218是n;以及x221是i。

362、實施例16.如實施例5-15中任一個所述的工程化dsrna連接酶多肽,其中該工程化dsrna連接酶多肽的氨基酸序列包含在一個或多個選自以下的氨基酸殘基中不同于seq?idno:302的序列的氨基酸序列:x39、x218和x221,其中編號是指seq?id?no:302,并且其中該工程化dsrna連接酶多肽具有dsrna連接酶活性;任選地,其中該工程化dsrna連接酶多肽的氨基酸序列包含以下氨基酸殘基中的一個或多個:x39是a;x218是n;以及x221是i。

363、實施例17.如實施例5-16中任一個所述的工程化dsrna連接酶多肽,其中該工程化dsrna連接酶多肽的氨基酸序列包含在一個或多個選自以下的氨基酸殘基中不同于seq?idno:302的序列的氨基酸序列:x39、x218、x221和x255,其中編號是指seq?id?no:302,并且其中該工程化dsrna連接酶多肽具有dsrna連接酶活性;任選地,其中該工程化dsrna連接酶多肽的氨基酸序列包含以下氨基酸殘基中的一個或多個:x39是a;x218是n;x221是i;以及x255是c。

364、實施例18.如實施例5-17中任一個所述的工程化dsrna連接酶多肽,其中該工程化dsrna連接酶多肽的氨基酸序列包含在一個或多個選自以下的氨基酸殘基中不同于seq?idno:302的序列的氨基酸序列:x39、x53、x218、x221、x237、x251、x255和x285,其中編號是指seq?id?no:302,并且其中該工程化dsrna連接酶多肽具有dsrna連接酶活性;任選地,其中該工程化dsrna連接酶多肽的氨基酸序列包含以下氨基酸殘基中的一個或多個:x39是a;x53是y;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a。

365、實施例19.如實施例5-18中任一個所述的工程化dsrna連接酶多肽,其中該工程化dsrna連接酶多肽的氨基酸序列包含在一個或多個選自以下的氨基酸殘基中不同于seq?idno:302的序列的氨基酸序列:x15、x39、x53、x218、x221、x237、x251、x255和x285,其中編號是指seq?id?no:302,并且其中該工程化dsrna連接酶多肽具有dsrna連接酶活性;任選地,其中該工程化dsrna連接酶多肽的氨基酸序列包含以下氨基酸殘基中的一個或多個:x15是e;x39是a;x?53是y;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a。

366、實施例20.如實施例5-19中任一個所述的工程化dsrna連接酶多肽,其中該工程化dsrna連接酶多肽的氨基酸序列包含在一個或多個選自以下的氨基酸殘基中不同于seq?idno:302的序列的氨基酸序列:x19、x39、x53、x218、x221、x237、x251、x255和x285,其中編號是指seq?id?no:302,并且其中該工程化dsrna連接酶多肽具有dsrna連接酶活性;任選地,其中該工程化dsrna連接酶多肽的氨基酸序列包含以下氨基酸殘基中的一個或多個:x19是d;x39是a;x53是y;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a。

367、實施例21.如實施例5-20中任一個所述的工程化dsrna連接酶多肽,其中該工程化dsrna連接酶多肽的氨基酸序列包含在一個或多個選自以下的氨基酸殘基中不同于seq?idno:302的序列的氨基酸序列:x15、x39、x53、x185、x218、x221、x237、x251、x255和x285,其中編號是指seq?id?no:302,并且其中該工程化dsrna連接酶多肽具有dsrna連接酶活性;任選地,其中該工程化dsrna連接酶多肽的氨基酸序列包含以下氨基酸殘基中的一個或多個:x15是d;x39是a;x?53是y;x185是k;x218是n;x221是i;x237是r;x251是l;x255是c;以及x285是a。

368、實施例22.如實施例1-21中任一個所述的工程化dsrna連接酶多肽,其中該工程化dsrna連接酶多肽包含純化標簽。

369、實施例23.如實施例22所述的工程化dsrna連接酶多肽,其包含選自由以下組成的組的氨基酸序列:seq?id?no:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298和300。

370、實施例24.如實施例22所述的工程化dsrna連接酶多肽,其包含選自由以下組成的組的氨基酸序列:seq?id?no:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632和634。

371、實施例25.一種通過化學(xué)鍵或物理吸附方法固定在固體材料上的多肽,其中該多肽包含根據(jù)實施例1-24中任一個所述的工程化dsrna連接酶多肽。

372、實施例26.一種多核苷酸,其編碼如實施例1-24中任一個所述的工程化dsrna連接酶多肽。

373、實施例27.如實施例26所述的多核苷酸,其中該多核苷酸序列是seq?id?no:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485、487、489、491、493、495、497、499、501、503、505、507、509、511、513、515、517、519、521、523、525、527、529、531、533、535、537、539、541、543、545、547、549、551、553、555、557、559、561、563、565、567、569、571、573、575、577、579、581、583、585、587、589、591、593、595、597或599。

374、實施例28.如實施例26所述的多核苷酸,其中該多核苷酸序列是seq?id?no:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485、487、489、491、493、495、497、499、501、503、505、507、509、511、513、515、517、519、521、523、525、527、529、531、533、535、537、539、541、543、545、547、549、551、553、555、557、559、561、563、565、567、569、571、573、575、577、579、581、583、585、587、589、591、593、595、597、599、601、603、605、607、609、611、613、615、617、619、621、623、625、627、629、631、633、635、637、639、641、643、645、647、649、651、653、655、657、659、661、663、665和667。

375、實施例29.一種表達載體,其包含如實施例26-28中任一個所述的多核苷酸。

376、實施例30.如實施例29所述的表達載體,其包含質(zhì)粒、黏粒、噬菌體或病毒載體。

377、實施例31.一種宿主細胞,其包含如實施例26-28中任一個所述的多核苷酸或如實施例29或30所述的表達載體,任選地其中該宿主細胞是大腸桿菌。

378、實施例32.一種制備工程化dsrna連接酶多肽的方法,其包括培養(yǎng)根據(jù)實施例31所述的宿主細胞并從培養(yǎng)物中獲得工程化dsrna連接酶多肽的步驟。

379、實施例33.通過培養(yǎng)根據(jù)實施例31所述的宿主細胞或根據(jù)實施例32所述的方法可獲得的工程化dsrna連接酶催化劑,其中所述工程化dsrna連接酶催化劑包含含有工程化dsrna連接酶多肽的細胞或培養(yǎng)液、或用其加工的物品,其中該物品是指從宿主細胞的培養(yǎng)物中獲得的提取物,通過從提取物中分離或純化工程化dsrna連接酶獲得的分離的產(chǎn)物或通過固定宿主細胞,其提取物或提取物的分離的產(chǎn)物獲得的固定的產(chǎn)物。

380、實施例34.從兩個或更多個寡核苷酸片段產(chǎn)生寡核苷酸的方法,其中該方法包括使以下接觸:

381、(i)兩個或更多個寡核苷酸片段;

382、(ii)根據(jù)實施例1-24中任一個所述的工程化dsrna連接酶多肽;

383、(iii)atp來源;以及

384、(iv)二價陽離子;

385、以獲得寡核苷酸。

386、實施例35.如實施例34所述的方法,其中該atp來源包含atp。

387、實施例36.如實施例34或35所述的方法,其中該atp來源包含:

388、(a)多磷酸激酶(ppk);

389、(b)多磷酸;以及

390、(c)amp和/或atp。

391、實施例37.如實施例36所述的方法,其中該ppk選自ppk12或ajpap。

392、實施例38.如實施例36或37中任一個所述的方法,其中該方法使用亞化學(xué)計量濃度的amp和/或atp進行。

393、實施例39.如實施例36-38中任一個所述的方法,其中該多磷酸是多磷酸鹽。

394、實施例40.如實施例39所述的方法,其中該多磷酸鹽是多磷酸鈉(馬德雷爾鹽)或六偏磷酸鈉(格蘭漢姆鹽)。

395、實施例41.如實施例34-40中任一個所述的方法,其中該二價陽離子輔因子是mg2+或mn2+。

396、實施例42.如實施例34-41中任一個所述的方法,其中該方法以5-100mm、任選地30-50mm的二價陽離子濃度進行。

397、實施例43.如實施例34-42中任一個所述的方法,其進一步包括純化寡核苷酸的步驟。

398、實施例44.根據(jù)實施例1-24中任一個所述的工程化dsrna連接酶多肽在從兩個或更多個寡核苷酸片段產(chǎn)生寡核苷酸中的用途。

399、實施例45.如實施例34-43中任一個所述的方法或如實施例44所述的用途,其中該寡核苷酸的長度為最多60個核苷酸。

400、實施例46.如實施例34-43或45中任一個所述的方法或如實施例44或45所述的用途,其中每個該寡核苷酸片段的長度為4-16個核苷酸,任選地長度為6-9個核苷酸。

401、實施例47.如實施例34-43、45或46所述的方法或如實施例44-46中任一個所述的用途,其中一個或多個該寡核苷酸片段包含一個或兩個突出端。

402、實施例48.如實施例34-43或45-47中任一個所述的方法或如實施例44-47中任一個所述的用途,其中一個或多個該寡核苷酸片段包含化學(xué)修飾。

403、實施例49.如實施例48所述的方法或用途,其中該化學(xué)修飾選自:

404、(a)經(jīng)修飾的主鏈,其任選地選自硫代磷酸酯(例如手性硫代磷酸酯)或甲基膦酸酯核苷酸間鍵;

405、(b)經(jīng)修飾的核苷酸,其任選地選自2’-o-甲基(2’-ome)、2’-氟(2’-f)、2’-脫氧、2’-脫氧-2’-氟、2’-o-甲氧基乙基(2’-o-moe)、2’-o-氨基丙基(2’-o-ap)、2’-o-二甲基氨基乙基(2’-o-dmaoe)、2’-o-二甲基氨基丙基(2’-o-dmap)、2’-o-二甲基氨基乙基氧基乙基(2’-o-dmaeoe)、2’-o-n-甲基乙酰胺基(2’-o-nma)、鎖核酸(lna)、乙二醇核酸(gna)、酰胺基磷酸酯(例如酰胺基磷酸甲磺酰酯)、2’,3’-斷裂核苷酸模擬物、2’-f-阿拉伯核苷酸、脫堿基核苷酸、2’-氨基修飾的核苷酸、2’-烷基-修飾的核苷酸、嗎啉代核苷酸、乙烯基膦酸酯(例如5’乙烯基膦酸酯)和環(huán)丙基膦酸酯脫氧核糖核苷酸;和/或

406、(c)與配體的綴合,任選地其中該配體包含一個或多個n-乙酰半乳糖胺(galnac)衍生物。

407、實施例50.一種組合物,其包含:

408、i.根據(jù)實施例1-24中任一個所述的工程化dsrna連接酶多肽;

409、ii.atp來源;以及

410、iii.二價陽離子。

411、實施例51.如實施例50所述的組合物,其進一步包含兩個或更多個寡核苷酸片段。

412、實施例52.一種試劑盒,其包含:

413、i.如根據(jù)實施例1-24中任一個所述的工程化dsrna連接酶多肽;

414、ii.atp來源;

415、iii.二價陽離子;以及

416、iv.從兩個或更多個寡核苷酸片段產(chǎn)生寡核苷酸的方法的使用說明書。

417、實施例53.如實施例50或51所述的組合物或如實施例52所述的試劑盒,其中該atp來源包含atp。

418、實施例54.如實施例50、51或53中任一個所述的組合物或如實施例52或53所述的試劑盒,其中該atp來源包含:

419、(a)多磷酸激酶(ppk);

420、(b)多磷酸;以及

421、(c)amp和/或atp。

422、實施例55.如實施例54所述的組合物或試劑盒,其中該ppk選自ppk12或ajpap。

423、實施例56.如實施例50、51或53-55中任一個所述的組合物或如實施例52-55中任一個所述的試劑盒,其中該多磷酸是多磷酸鹽。

424、實施例57.如實施例56所述的組合物或試劑盒,其中該多磷酸鹽是多磷酸鈉(馬德雷爾鹽)或六偏磷酸鈉(格蘭漢姆鹽)。

425、實施例58.如實施例50、51或53-57中任一個所述的組合物或如實施例52-57中任一個的試劑盒,其中該二價陽離子輔因子是mg2+或mn2+。

426、本披露的不同特征和實施例在以下代表性實例中進行了舉例說明,這些實例旨在是說明性的而非限制性的。

427、實例

428、提供以下實例,包括實驗和所實現(xiàn)的結(jié)果,僅用于說明性目的,并且不應(yīng)被解釋為限制本發(fā)明。

429、在下面的實例中,以下縮寫適用:ppm(百萬分率);m(摩爾);mm(毫摩爾)、um和μm(微摩爾);nm(納摩爾);mol(摩爾);gm和g(克);mg(毫克);ug和μg(微克);l和l(升);ml和ml(毫升);cm(厘米);mm(毫米);um和μm(微米);sec.(秒);min(分鐘);h和hr(小時);u(單位);mw(分子量);rpm(每分鐘轉(zhuǎn)數(shù));psi和psi(磅每平方英寸);℃(攝氏度);rt和rt(室溫);od600(600nm處的光密度)、cam和cam(氯霉素);dmso(二甲基亞砜);fp(發(fā)酵粉末);fwc(冷凍全細胞)、lwc(凍干全細胞)、pmbs(硫酸多粘菌素b);iptg(異丙基β-d-1-硫代半乳吡喃糖苷);lb(溶菌肉湯);tb(超級肉湯;12g/l胰蛋白胨、24g/l酵母提取物、4ml/l甘油、65mm磷酸鉀(ph?7.0)、1mm?mgso4);teoa(三乙醇胺緩沖液)、hepes(hepes兩性離子緩沖液;4-(2-羥乙基)-哌嗪乙磺酸);sfp(搖瓶粉末);cds(編碼序列);dna(脫氧核糖核酸);rna(核糖核酸);大腸桿菌w3110(常用的實驗室大腸桿菌菌株,可從大腸桿菌遺傳保藏中心[cgsc](康涅狄格州紐黑文(new?haven,ct))獲得);htp(高通量);hplc(高壓液相色譜法);fiop(相對于陽性對照的改善倍數(shù));微流體公司(微流體公司(microfluidics,corp.),馬薩諸塞州韋斯特伍德(westwood,ma));西格瑪奧德里奇公司(西格瑪奧德里奇公司(sigma-aldrich),密蘇里州圣路易斯(st.louis,mo));difco公司(difco實驗室公司(difco?laboratories),bd診斷系統(tǒng)公司(bd?diagnostic?systems),密歇根州底特律(detroit,mi));安捷倫公司(安捷倫科技公司(agilent?technologies,inc.),加利福尼亞州圣克拉拉(santa?clara,ca));康寧公司(康寧公司(corning,inc.),加利福尼亞州帕洛阿爾托(palo?alto,ca));道康寧公司(道康寧公司(dow?corning,corp.),密歇根州米德蘭(midland,mi));和基因甲骨文公司(基因甲骨文公司(gene?oracle,inc.),加利福尼亞州山景城(mountain?view,ca))。

430、表1中提供了整個實例中在括號內(nèi)提及的寡核苷酸的序列(例如“sirna(1)”和“寡核苷酸(2)”)。

431、實例1

432、分離的酶的制備

433、將編碼具有連接酶活性的多肽的多核苷酸克隆至pck110900載體系統(tǒng)中(參見例如美國專利申請?zhí)?006/0195947a1圖3,其通過引用以其全文并入本文),并隨后在大腸桿菌w3110fhua中在lac啟動子的控制下表達。表達載體還含有p15a復(fù)制起點和氯霉素(cam)抗性基因。

434、用含有連接酶編碼基因的pck110900質(zhì)粒轉(zhuǎn)化大腸桿菌w3110fhua細胞。將轉(zhuǎn)化的細胞鋪在含有1%葡萄糖和30μg/ml?cam的溶菌肉湯(lb)瓊脂平板上,并在37℃下生長過夜。隨后將單菌落接種到250ml帶擋板的搖瓶中的補充有30μg/ml?cam和1%葡萄糖的25mllb中。將培養(yǎng)物在37℃、250rpm下振搖的培養(yǎng)箱中生長過夜(16-20小時,光密度(od600)>3.8)。將5ml過夜生長的培養(yǎng)物接種到含有250ml超級肉湯(tb)培養(yǎng)基(含30μg/ml?cam)的1l搖瓶中。將250ml培養(yǎng)物在30℃、250rpm下孵育3-3.5小時,直至od600達到0.6-0.8。通過添加最終濃度為1mm的異丙基-β-d-硫代半乳糖苷(iptg)來誘導(dǎo)連接酶基因的表達,并繼續(xù)生長另外18-20小時。將培養(yǎng)物轉(zhuǎn)移至離心瓶中,然后將其在4℃下以7,000rpm離心5分鐘來收獲細胞。棄去上清液,并裂解剩余的細胞沉淀。對于裂解,將細胞沉淀重懸于30ml的50mmtris-緩沖液(ph?7.5)中,并使用lm20處理器系統(tǒng)(微流體公司)進行裂解。在4℃下以14,000rpm離心30分鐘去除細胞碎片。然后使用本領(lǐng)域已知的標準技術(shù)(包括固定化金屬親和層析)從澄清的裂解物中分離連接酶。

435、實例2

436、用于生產(chǎn)sirna(1)的dsrna連接酶活性的鑒定

437、為了鑒定用于生產(chǎn)包含寡核苷酸(2)和(3)的sirna(1)的具有dsrna連接酶活性的酶,首先對連接酶的集合進行了篩選,以生產(chǎn)包含寡核苷酸(3)和(5)的替代產(chǎn)物sirna(4)。寡核苷酸(5)的序列與寡核苷酸(2)相同,但其不含3’-galnac部分。圖1中描繪了sirna(1)和(4)以及寡核苷酸(2)、(3)和(5);表1中提供了寡核苷酸(2)、(3)和(5)的序列。

438、在pcr管中的20μl反應(yīng)體積中對分離的連接酶進行了篩選,每管含有50mm?tris-緩沖液(ph?7.5)、1mm?atp或1mm?nad+、10mm?mgcl2、5mm?dtt和10μm(每種)底物寡核苷酸(6-11)以及50%(v/v)分離的連接酶。將反應(yīng)物在16℃的熱循環(huán)儀中孵育2h,并使用本領(lǐng)域已知的標準技術(shù)(包括電泳)進行分析。具有seq?id?no:2的連接酶對sirna(4)的形成表現(xiàn)出最高的dsrna連接酶活性。隨后使用多種酶制劑,包括分離的酶(實例1)、澄清的裂解物(實例4)和搖瓶粉末(sfp;實例5),證實了seq?id?no:2用于生產(chǎn)sirna(1)的活性。

439、表1寡核苷酸序列

440、

441、實例3

442、用于高通量(htp)篩選的細胞沉淀的制備

443、在96孔格式中挑取單菌落,并在含有1%葡萄糖和30μg/ml?cam的190μl?lb培養(yǎng)基中于30℃、200rpm和85%濕度下生長。過夜生長后,將20μl生長的培養(yǎng)物轉(zhuǎn)移至含有380μltb培養(yǎng)基(含30μg/ml?cam)的深孔板中。培養(yǎng)物在30℃、250rpm和85%濕度下生長約2.5小時。當培養(yǎng)物的od600達到0.4-0.8時,通過添加最終濃度為1mm的iptg來誘導(dǎo)連接酶基因的表達。誘導(dǎo)后,在30℃、250rpm和85%濕度下繼續(xù)生長18-20小時。通過在4℃下以4,000rpm離心10分鐘收獲細胞;然后棄去上清液。將細胞沉淀儲存在-80℃下直至準備使用。

444、實例4

445、裂解和澄清的裂解物的制備

446、在進行測定之前,將細胞沉淀解凍并重懸于300μl裂解緩沖液(在50mm?tris-緩沖液(ph?7.5)中含有1g/l溶菌酶、0.5g/l?pmbs和0.1μl/ml或0.2u/ml商業(yè)dnase(新英格蘭生物實驗室公司,m0303l))中。通過在微量滴定板振蕩器上于室溫下中速振搖2.5小時,對平板進行攪拌。然后將平板在4℃下以4,000rpm離心10分鐘,并將澄清的上清液用在htp測定反應(yīng)中,用于活性測定,如以下實例中所述。

447、實例5

448、搖瓶粉末(sfp)和發(fā)酵粉末(fp)的制備

449、搖瓶程序可用于生成工程化dsrna連接酶多肽搖瓶粉末(sfp),其可用于二次篩選測定和/或用于本文所述的生物催化過程。與htp測定中使用的細胞裂解物相比,酶的搖瓶粉末制劑可提供更濃縮的工程化酶制劑。

450、使用本領(lǐng)域已知的標準方法收集根據(jù)實例1生產(chǎn)的澄清的裂解物,在-80℃下冷凍,然后凍干。對冷凍的澄清裂解物進行凍干,可得到含有粗野生型或工程化dsrna連接酶多肽的干sfp。

451、實例6

452、活性和選擇性評價的分析方法

453、使用表6-1和表6-2中描述的方法通過高壓液相色譜法(hplc)分析了工程化dsrna連接酶的活性改善。開發(fā)了帶有uv檢測的hplc方法來分析產(chǎn)物寡核苷酸(2)和(3)的形成。分析方法的目標是在最短的運行時間內(nèi)實現(xiàn)產(chǎn)物寡核苷酸(2)和(3)的良好分離。結(jié)果,六種底物(6-7,9-12)和四種中間體(13-16)寡核苷酸不能很好地彼此分離。然而,可以分離明確限定的含galnac的寡核苷酸,包括底物寡核苷酸(12)、反應(yīng)中間體寡核苷酸(14)和產(chǎn)物寡核苷酸(2)。因此,可以計算偽轉(zhuǎn)化%,用任意單位(au)表示,其僅考慮這些根據(jù)以下公式很好分離的物質(zhì):

454、

455、其中ε(2)、ε(12)和ε(14)分別是寡核苷酸(2)、(12)和(14)的消光系數(shù)。使用這樣的計算,au=1.0將意味著反應(yīng)中不再存在含有g(shù)alnac的底物或中間體寡核苷酸,并且它們已全部轉(zhuǎn)化為含有g(shù)alnac的產(chǎn)物(2)。實際上,對于au=1.0的樣品,色譜圖中存在的唯一其他峰與產(chǎn)物寡核苷酸(2)相對應(yīng),并且無法鑒定其他中間體或起始物料。另外,產(chǎn)物寡核苷酸(2)和(3)的比率與sirna產(chǎn)物(1)的真實標準一致。綜上所述,可以得出的結(jié)論是au=1.0是一個近似值,其基本上相當于100%轉(zhuǎn)化。

456、表6-1:用于活性測定的hplc方法1。

457、

458、

459、hplc方法2(表6-2)根據(jù)hplc方法1(表6-1)開發(fā),以改善產(chǎn)物寡核苷酸(3)和底物寡核苷酸(12)之間的分離。

460、表6-2:用于活性測定的hplc方法1。

461、

462、

463、還使用表6-3中描述的方法通過質(zhì)譜法(rf-ms)分析了實例12的工程化dsrna連接酶的活性改善。與hplc分析相比,rf-ms旨在縮短分析時間。通過在多單離子監(jiān)測(sim)模式下分析每個產(chǎn)物寡核苷酸的比質(zhì)量來獲得產(chǎn)物寡核苷酸(2)和(3)的選擇性檢測。通過比較與每個產(chǎn)物寡核苷酸(2)和(3)相對應(yīng)的五個比質(zhì)量(在表6-3中給出)的ms信號總和,測定相對的dsrna連接酶活性。

464、表6-3:用于活性測定的rf-ms方法。

465、

466、

467、本文提供的方法可用于分析使用本發(fā)明生產(chǎn)的變體。然而,本發(fā)明并不有意局限于本文所述的方法,因為本領(lǐng)域已知的其他合適的方法也適用于分析本文提供的變體和/或使用本文提供的方法生產(chǎn)的變體。

468、實例7

469、用于改善sirna產(chǎn)物(1)生產(chǎn)的來源于seq?id?no:2的工程化多肽的第1輪進化和篩選

470、使用編碼具有seq?id?no:2的dsrna連接酶活性的多肽的工程化多核苷酸(seq?idno:1)來生成表7-1的工程化多肽。與起始多肽相比,這些多肽在期望的條件下表現(xiàn)出改善的dsrna連接酶活性,例如,從底物寡核苷酸(6-7,9-12)原位產(chǎn)生的寡核苷酸產(chǎn)物(2)或(3)或優(yōu)選地寡核苷酸產(chǎn)物(2)和(3)的形成的改善。與起始多肽相比,一些多肽表現(xiàn)出寡核苷酸產(chǎn)物(2)或(3)或寡核苷酸產(chǎn)物(2)和(3)的產(chǎn)物形成改善,如表7-1中所示。表1中提供了寡核苷酸(2)、(3)、(6)、(7)和(9-12)的序列。

471、具有偶數(shù)編號序列標識符的氨基酸序列的工程化多肽是從seq?id?no:2的“主鏈”氨基酸序列生成的,如下所述以及使用表6-1中描述的分析方法。定向進化從seq?id?no:1所示的多核苷酸開始。使用多種眾所周知的技術(shù)(例如,飽和誘變、先前鑒定的有益氨基酸差異的重組)生成工程化多肽文庫,并使用htp測定和如下所述的測量多肽產(chǎn)生寡核苷酸產(chǎn)物(2)和(3)的能力的分析方法進行篩選。

472、酶測定在96孔pcr板中進行,每孔總反應(yīng)體積為50μl。反應(yīng)物含有2.5%(v/v)未稀釋的dsrna連接酶裂解物(如實例4中所述制備的)、100μm(每種)底物寡核苷酸(6-7,9-12)、50mm?tris-緩沖液(ph?7.5)、1mm?atp、10mm?mgcl2和5mm?dtt。將反應(yīng)板熱封并在熱循環(huán)儀中于30℃下孵育2h。

473、孵育后,對平板進行熱滅活步驟(95℃,20min)以淬滅反應(yīng)并沉淀所添加的裂解物的蛋白質(zhì)內(nèi)容物。然后將平板以4,000rpm離心5min。隨后從每個孔中取出2μl上清液等分試樣,并添加到含有98μl?5mm?edta溶液(ph?7.0)的淺孔96孔板中。使用表6-1中描述的分析方法,通過hplc分析樣品以測定酶變體的活性。顯示相對于seq?id?no:2形成更多寡核苷酸產(chǎn)物(2)和(3)的所選連接酶變體在表7-1中示出。

474、

475、

476、

477、由seq?id?no:4至106的偶數(shù)編號序列標識符表示的工程化dsrna連接酶多肽分別包含seq?id?no:304至406的偶數(shù)編號序列標識符以及14個氨基酸n-末端純化標簽(mhhhhhhenlyfqs(seq?id?no:669))。例如,seq?id?no:4包含:(i)seq?id?no:669的14個氨基酸n端純化標簽;以及(ii)seq?id?no:304的dsrna連接酶多肽。

478、在整個實例中,提供了給定突變相對于seq?id?no:2的位置,其包括(i)seq?idno:669的14個氨基酸n端純化標簽以及(ii)seq?id?no:302的野生型dsrna連接酶多肽。給定突變相對于seq?id?no:302(即,沒有純化標簽的野生型dsrna連接酶多肽)的位置可以通過從實例中描述的seq?id?no中減去14個氨基酸的n端純化標簽來獲得。例如,seq?id?no:2的位置x251對應(yīng)于seq?id?no:302的位置x237。

479、實例8

480、用于改善sirna產(chǎn)物(1)生產(chǎn)的來源于seq?id?no:70的工程化多肽的第2輪進化和篩選

481、使用來自編碼具有seq?id?no:70的dsrna連接酶活性的活性最高的多肽的實例7seq?id?no:69的多核苷酸來生成表8-1的工程化多肽。與起始多肽相比,這些多肽在期望的條件下表現(xiàn)出改善的dsrna連接酶活性,例如,從底物寡核苷酸(6-7,9-12)原位產(chǎn)生的寡核苷酸產(chǎn)物(2)或(3)或優(yōu)選地寡核苷酸產(chǎn)物(2)和(3)的形成的改善。與起始多肽相比,一些多肽表現(xiàn)出寡核苷酸產(chǎn)物(2)和(3)的產(chǎn)物形成改善,如表8-1中所示。具有偶數(shù)編號序列標識符的氨基酸序列的工程化多肽是從seq?id?no:70的“主鏈”氨基酸序列生成的,如下所述以及使用表6-1中描述的分析方法。

482、定向進化從seq?id?no:69所示的多核苷酸開始。使用多種眾所周知的技術(shù)(例如,飽和誘變、先前鑒定的有益氨基酸差異的重組)生成工程化多肽文庫,并使用htp測定和如下所述的測量多肽產(chǎn)生寡核苷酸(2)和(3)的能力的分析方法進行篩選。

483、酶測定在96孔pcr板中進行,每孔總反應(yīng)體積為50μl。反應(yīng)物含有1.25或2.5%(v/v)未稀釋的dsrna連接酶裂解物(如實例4中所述制備的)、100μm(每種)底物寡核苷酸(6-7,9-12)、50mm?tris-緩沖液(ph?7.5)、1mm?atp、10mm?mgcl2和5mm?dtt。將反應(yīng)板熱封并在熱循環(huán)儀中于30℃下孵育2h。

484、孵育后,對平板進行熱滅活步驟(95℃,20min)以淬滅反應(yīng)并沉淀所添加的裂解物的蛋白質(zhì)內(nèi)容物。然后將平板以4,000rpm離心5min。隨后從每個孔中取出2μl上清液等分試樣,并添加到含有98μl?5mm?edta溶液(ph?7.0)的淺孔96孔板中。使用表6-1中描述的分析方法,通過hplc分析樣品以測定酶變體的活性。顯示相對于seq?id?no:70更快形成寡核苷酸產(chǎn)物(2)和(3)的所選連接酶變體在表8-1中示出。

485、

486、

487、

488、由seq?id?no:108至216的偶數(shù)編號序列標識符表示的工程化dsrna連接酶多肽分別包含seq?id?no:408至516的偶數(shù)編號序列標識符以及14個氨基酸n-末端純化標簽(mhhhhhhenlyfqs(seq?id?no:669))。例如,seq?id?no:108包含:(i)seq?id?no:669的14個氨基酸n端純化標簽;以及(ii)seq?id?no:408的dsrna連接酶多肽。

489、實例9

490、用于改善sirna產(chǎn)物(1)生產(chǎn)的來源于seq?id?no:188的工程化多肽的第3輪進化和篩選

491、使用來自編碼具有seq?id?no:188的dsrna連接酶活性的活性最高的多肽的實例8seq?id?no:187的多核苷酸來生成表9-1的工程化多肽。與起始多肽相比,這些多肽在期望的條件下表現(xiàn)出改善的dsrna連接酶活性,例如,從底物寡核苷酸(6-7,9-12)原位產(chǎn)生的寡核苷酸產(chǎn)物(2)或(3)或優(yōu)選地寡核苷酸產(chǎn)物(2)和(3)的形成的改善。與起始多肽相比,一些多肽表現(xiàn)出寡核苷酸產(chǎn)物(2)和(3)的產(chǎn)物形成改善,如表9-1中所示。具有偶數(shù)編號序列標識符的氨基酸序列的工程化多肽是從seq?id?no:188的“主鏈”氨基酸序列生成的,如下所述以及使用表6-2中描述的分析方法。

492、定向進化從seq?id?no:187所示的多核苷酸開始。使用多種眾所周知的技術(shù)(例如,飽和誘變、先前鑒定的有益氨基酸差異的重組)生成工程化多肽文庫,并使用htp測定和如下所述的測量多肽產(chǎn)生寡核苷酸(2)和(3)的能力的分析方法進行篩選。

493、酶測定在96孔pcr板中進行,每孔總反應(yīng)體積為100μl。反應(yīng)物含有20%(v/v)未稀釋的dsrna連接酶裂解物(如實例4中所述制備的)、1mm(每種)底物寡核苷酸(6-7,9-12)、50mm?tris-緩沖液(ph7.0)、10mm?atp、20mm?mgcl2、5mm?dtt和10%(v/v)dmso。將反應(yīng)板熱封并在熱循環(huán)儀中于30℃下孵育2h。

494、孵育后,對平板進行熱滅活步驟(95℃,20min)以淬滅反應(yīng)并沉淀所添加的裂解物的蛋白質(zhì)內(nèi)容物。然后將平板以4,000rpm離心5min。隨后從每個孔中取出50μl上清液等分試樣,并添加到含有450μl?5mm?edta溶液(ph?7.0)的深孔96孔板中。通過將50μl稀釋的樣品轉(zhuǎn)移至含有950μl?5mm?edta溶液(ph?7.0)的深孔96孔板中,進一步稀釋樣品。使用表6-2中描述的分析方法,通過hplc分析樣品以測定酶變體的活性。顯示相對于seq?id?no:188更快形成寡核苷酸產(chǎn)物(2)和(3)的所選連接酶變體在表9-1中示出。

495、

496、

497、由seq?id?no:218至246的偶數(shù)編號序列標識符表示的工程化dsrna連接酶多肽分別包含seq?id?no:518至546的偶數(shù)編號序列標識符以及14個氨基酸n-末端純化標簽(mhhhhhhenlyfqs(seq?id?no:669))。例如,seq?id?no:218包含:(i)seq?id?no:669的14個氨基酸n端純化標簽;以及(ii)seq?id?no:518的dsrna連接酶多肽。

498、實例10

499、用于改善sirna產(chǎn)物(1)生產(chǎn)的來源于seq?id?no:226的工程化多肽的第4輪進化和篩選

500、使用來自編碼具有seq?id?no:226的dsrna連接酶活性的活性最高的多肽的實例9seq?id?no:225的多核苷酸來生成表10-1的工程化多肽。與起始多肽相比,這些多肽在期望的條件下表現(xiàn)出改善的dsrna連接酶活性,例如,從底物寡核苷酸(6-7,9-12)原位產(chǎn)生的寡核苷酸產(chǎn)物(2)或(3)或優(yōu)選地寡核苷酸產(chǎn)物(2)和(3)的形成的改善。與起始多肽相比,一些多肽表現(xiàn)出寡核苷酸產(chǎn)物(2)和(3)的產(chǎn)物形成改善,如表10-1中所示。具有偶數(shù)編號序列標識符的氨基酸序列的工程化多肽是從seq?id?no:226的“主鏈”氨基酸序列生成的,如下所述以及使用表6-2中描述的分析方法。

501、定向進化從seq?id?no:225所示的多核苷酸開始。使用多種眾所周知的技術(shù)(例如,飽和誘變、先前鑒定的有益氨基酸差異的重組)生成工程化多肽文庫,并使用htp測定和如下所述的測量多肽產(chǎn)生寡核苷酸(2)和(3)的能力的分析方法進行篩選。

502、酶測定在96孔pcr板中進行,每孔總反應(yīng)體積為100μl。反應(yīng)物含有2.5%(v/v)未稀釋的dsrna連接酶裂解物(如實例4中所述制備的)、1mm(每種)底物寡核苷酸(6-7,9-12)、50mm?tris-緩沖液(ph7.0)、10mm?atp、20mm?mgcl2、5mm?dtt和10%(v/v)dmso。將反應(yīng)板熱封并在熱循環(huán)儀中于30℃下孵育24h。

503、孵育后,對平板進行熱滅活步驟(95℃,20min)以淬滅反應(yīng)并沉淀所添加的裂解物的蛋白質(zhì)內(nèi)容物。然后將平板以4,000rpm離心5min。隨后從每個孔中取出50μl上清液等分試樣,并添加到含有450μl?5mm?edta溶液(ph?7.0)的深孔96孔板中。通過將50μl稀釋的樣品轉(zhuǎn)移至含有950μl?5mm?edta溶液(ph?7.0)的深孔96孔板中,進一步稀釋樣品。使用表6-2中描述的分析方法,通過hplc分析樣品以測定酶變體的活性。顯示相對于seq?id?no:226更快形成寡核苷酸產(chǎn)物(2)和(3)的所選連接酶變體在表10-1中示出。

504、

505、

506、由seq?id?no:248至282的偶數(shù)編號序列標識符表示的工程化dsrna連接酶多肽分別包含seq?id?no:548至582的偶數(shù)編號序列標識符以及14個氨基酸n-末端純化標簽(mhhhhhhenlyfqs(seq?id?no:669))。例如,seq?id?no:248包含:(i)seq?id?no:669的14個氨基酸n端純化標簽;以及(ii)seq?id?no:548的dsrna連接酶多肽。

507、實例11

508、用于改善sirna產(chǎn)物(1)生產(chǎn)的來源于seq?id?no:278的工程化多肽的第5輪進化和篩選

509、使用來自編碼具有seq?id?no:278的dsrna連接酶活性的活性最高的多肽的實例10seq?id?no:277的多核苷酸來生成表11-1的工程化多肽。與起始多肽相比,這些多肽在期望的條件下表現(xiàn)出改善的dsrna連接酶活性,例如,從底物寡核苷酸(6-7,9-12)原位產(chǎn)生的寡核苷酸產(chǎn)物(2)或(3)或優(yōu)選地寡核苷酸產(chǎn)物(2)和(3)的形成的改善。與起始多肽相比,一些多肽表現(xiàn)出寡核苷酸產(chǎn)物(2)和(3)的產(chǎn)物形成改善,如表11-1中所示。具有偶數(shù)編號序列標識符的氨基酸序列的工程化多肽是從seq?id?no:278的“主鏈”氨基酸序列生成的,如下所述以及使用表6-2中描述的分析方法。

510、定向進化從seq?id?no:277所示的多核苷酸開始。使用多種眾所周知的技術(shù)(例如,飽和誘變、先前鑒定的有益氨基酸差異的重組)生成工程化多肽文庫,并使用htp測定和如下所述的測量多肽產(chǎn)生寡核苷酸(2)和(3)的能力的分析方法進行篩選。

511、酶測定在96孔pcr板中進行,每孔總反應(yīng)體積為100μl。反應(yīng)物含有10%(v/v)未稀釋的dsrna連接酶裂解物(如實例4中所述制備的)、5mm(每種)底物寡核苷酸(6-7,9-12)、50mm?tris-緩沖液(ph7.0)、30mm?atp、60mm?mgcl2和10%(v/v)dmso。將反應(yīng)板熱封并在熱循環(huán)儀中于30℃下孵育24h。

512、孵育后,對平板進行熱滅活步驟(95℃,20min)以淬滅反應(yīng)并沉淀所添加的裂解物的蛋白質(zhì)內(nèi)容物。然后將平板以4,000rpm離心5min。隨后從每個孔中取出50μl上清液等分試樣,并添加到含有950μl?5mm?edta溶液(ph?7.0)的深孔96孔板中。通過將50μl稀釋的樣品轉(zhuǎn)移至含有450μl?5mm?edta溶液(ph?7.0)的深孔96孔板中,進一步稀釋樣品。通過將160μl稀釋的樣品轉(zhuǎn)移至含有640μl?5mm?edta溶液(ph?7.0)的深孔96孔板中,第三次稀釋樣品。通過將75μl稀釋的樣品轉(zhuǎn)移至含有75μl?5mm?edta溶液(ph?7.0)的深孔96孔板中,最后一次稀釋樣品。使用表6-2中描述的分析方法,通過hplc分析樣品以測定酶變體的活性。顯示相對于seq?id?no:278更快形成寡核苷酸產(chǎn)物(2)和(3)的所選連接酶變體在表11-1中示出。

513、

514、由seq?id?no:284至300的偶數(shù)編號序列標識符表示的工程化dsrna連接酶多肽分別包含seq?id?no:584至600的偶數(shù)編號序列標識符以及14個氨基酸n-末端純化標簽(mhhhhhhenlyfqs(seq?id?no:669))。例如,seq?id?no:284包含:(i)seq?id?no:669的14個氨基酸n端純化標簽;以及(ii)seq?id?no:584的dsrna連接酶多肽。

515、實例12

516、用于改善sirna產(chǎn)物(1)生產(chǎn)和改善熱穩(wěn)定性的來源于seq?id?no:288的工程化多肽的第6輪進化和篩選

517、使用來自編碼具有seq?id?no:288的dsrna連接酶活性的活性最高的多肽的實例11seq?id?no:287的多核苷酸來生成表12-1的工程化多肽。與起始多肽相比,這些多肽在期望的條件下表現(xiàn)出改善的dsrna連接酶活性,例如,從底物寡核苷酸(6-7,9-12)原位產(chǎn)生的寡核苷酸產(chǎn)物(2)或(3)或優(yōu)選地寡核苷酸產(chǎn)物(2)和(3)的形成的改善。與起始多肽相比,一些多肽表現(xiàn)出寡核苷酸產(chǎn)物(2)和(3)的產(chǎn)物形成改善,如表12-1中所示。此外,一些多肽表現(xiàn)出改善的熱穩(wěn)定性,在設(shè)置反應(yīng)之前將dsrna連接酶溶液在30℃下孵育1h后得到更高的殘余活性(表12-2)。具有偶數(shù)編號序列標識符的氨基酸序列的工程化多肽是從seq?idno:288的“主鏈”氨基酸序列生成的,如下所述以及使用表6-3中描述的分析方法。

518、定向進化從seq?id?no:287所示的多核苷酸開始。使用多種眾所周知的技術(shù)(例如,飽和誘變、先前鑒定的有益氨基酸差異的重組)生成工程化多肽文庫,并使用htp測定和如下所述的測量多肽產(chǎn)生寡核苷酸(2)和(3)的能力的分析方法進行篩選。

519、酶測定在96孔pcr板中進行,每孔總反應(yīng)體積為100μl。根據(jù)實例4裂解細胞,但用100mm?mops-緩沖液(ph?7.2)代替50mm?tris(ph?7.5)。為了提供熱挑戰(zhàn)并鑒定出更具熱穩(wěn)定性的命中點,細胞裂解物未稀釋或在100mm?mops緩沖液(ph?7.2)中按1:1稀釋,并分別在30℃和4℃下孵育1h。對于在30℃下孵育的裂解物,反應(yīng)物中的最終dsrna連接酶濃度為40%(v/v),并且對于在4℃下孵育的裂解物,反應(yīng)物中的最終dsrna連接酶濃度為20%(v/v)。此外,連接反應(yīng)物還含有3mm(每種)底物寡核苷酸(6-7,9-12)、100mm?mops-緩沖液(ph7.2)、30mm?atp、60mm?mgcl2和10%(v/v)dmso。將反應(yīng)板熱封并在熱循環(huán)儀中于30℃下孵育24h。

520、孵育后,對平板進行熱滅活步驟(95℃,20min)以淬滅反應(yīng)并沉淀所添加的裂解物的蛋白質(zhì)內(nèi)容物。然后將平板以4,000rpm離心5min。隨后從每個孔中取出50μl上清液等分試樣,并添加到含有950μl?5mm?edta溶液(ph?7.0)的深孔96孔板中。通過將20μl稀釋的樣品轉(zhuǎn)移至含有180μl?5mm?edta溶液(ph?7.0)的深孔96孔板中,進一步稀釋樣品。通過將30μl稀釋的樣品轉(zhuǎn)移至含有150μl?5mm?edta溶液(ph?7.0)的深孔96孔板中,第三次稀釋樣品。使用表6-3中描述的分析方法,通過rf-ms分析樣品以測定酶變體的活性。在4℃下預(yù)孵育后顯示相對于seq?id?no:288更快形成寡核苷酸產(chǎn)物(2)和(3)的所選連接酶變體在表12-1中示出。在30℃下預(yù)孵育后顯示相對于seq?id?no:288更快形成寡核苷酸產(chǎn)物(2)和(3)的所選連接酶變體在表12-2中示出。

521、

522、

523、

524、

525、由seq?id?no:602至634的偶數(shù)編號序列標識符表示的工程化dsrna連接酶多肽分別包含seq?id?no:636至668的偶數(shù)編號序列標識符以及14個氨基酸n-末端純化標簽(mhhhhhhenlyfqs(seq?id?no:669))。例如,seq?id?no:602包含:(i)seq?id?no:669的14個氨基酸n端純化標簽;以及(ii)seq?id?no:636的dsrna連接酶多肽。

526、實例13

527、野生型多肽seq?id?no:2與工程化多肽seq?id?no:288、seq?id?no:290和seq?idno:292的催化活性的比較

528、編碼來自噬菌體rb69的野生型dsrna連接酶(uniprot?id:q7y4v8)的多核苷酸seqid?no:1連同seq?id?no:2以及編碼來自實例11的改善最大的變體的工程化多核苷酸seqid?no:287、seq?id?no:289和seq?id?no:291連同多肽序列seq?id?no:288、seq?id?no:290和seq?id?no:292用于如實例5中所述的sfp生產(chǎn)。

529、在以下兩種反應(yīng)條件下評價將底物寡核苷酸(6-7,9-12)轉(zhuǎn)化為期望的sirna產(chǎn)物(1)的催化活性:條件1(50mm?tris-緩沖液(ph?7.5)、1mm?atp、5mm?mgcl2和5mm?dtt,含有0g/l、0.0020g/l、0.0039g/l、0.0078g/l、0.0156g/l、0.0313g/l、0.0625g/l、0.125g/l、0.25g/l、0.5g/l、1g/l或2g/l?sfp)和條件2(50mm?tris-緩沖液(ph?7.0)、30mm?atp、60mmmgcl2和10%(v/v)dmso,含有0g/l、0.0049g/l、0.0098g/l、0.0195g/l、0.0391g/l、0.0781g/l、0.1563g/l、0.3125g/l、0.625g/l、1.25g/l、2.5g/l或5g/l?sfp)。酶測定在96孔pcr板中進行,每孔總反應(yīng)體積為100μl;反應(yīng)板1中的條件1和反應(yīng)板2中的條件2。將兩個反應(yīng)板熱封并在熱循環(huán)儀中于30℃下孵育。反應(yīng)板1孵育2h,反應(yīng)板2孵育24h。

530、孵育后,對平板進行熱滅活步驟(95℃,20min)以淬滅反應(yīng)并沉淀所添加的sfp的蛋白質(zhì)內(nèi)容物。然后將平板以4,000rpm離心5min。從每個板的每個孔中取出50μl上清液等分試樣,然后在50mm?edta溶液(ph?7.0)中稀釋。反應(yīng)板1稀釋40倍,反應(yīng)板2稀釋2400倍。使用表6-2中描述的分析方法,通過hplc分析樣品以測定酶變體的活性。

531、圖2a和圖2b中的比較性數(shù)據(jù)顯示分別在條件1和2下測定的反應(yīng)樣品中存在的sirna(1)的相對峰面積%。在條件1和2下,多肽seq?id?no:288、seq?id?no:290和seq?idno:292表現(xiàn)出比野生型多肽seq?id?no:2改善的dsrna連接酶活性。

532、實例14

533、野生型多肽seq?id?no:2與工程化多肽seq?id?no:288和632的催化活性的比較

534、編碼來自噬菌體rb69的野生型dsrna連接酶(uniprot?id:q7y4v8)的多核苷酸seqid?no:1連同seq?id?no:2以及編碼來自實例11和實例12的改善最大的變體的工程化多核苷酸seq?id?no:287和seq?idno:631連同多肽序列seq?id?no:288和seq?id?no:632用于如實例5中所述的sfp生產(chǎn)。

535、通過將sfp的儲備溶液在4℃或37℃下孵育4h來評價將底物寡核苷酸(6-7,9-12)轉(zhuǎn)化為期望的sirna產(chǎn)物(1)的催化活性以及兩種酶的熱穩(wěn)定性,然后設(shè)置以下連接反應(yīng):6mm(每種)底物寡核苷酸(6-7,9-12)、100mm?mops-緩沖液(ph?7.2)、30mm?atp、60mm?mgcl2和10%(v/v)dmso。另外,連接反應(yīng)物還含有0g/l、0.156g/l、0.313g/l、0.625g/l、1.25g/l、2.5g/l、5g/l或10g/l的sfp。酶測定在96孔pcr板中進行,每孔總反應(yīng)體積為100μl。將反應(yīng)板熱封并在熱循環(huán)儀中于30℃下孵育24h。

536、孵育后,對平板進行熱滅活步驟(95℃,20min)以淬滅反應(yīng)并沉淀所添加的sfp的蛋白質(zhì)內(nèi)容物。然后將平板以4,000rpm離心5min。從每個板的每個孔中取出50μl上清液等分試樣,然后在50mm?edta溶液(ph?7.0)中稀釋400倍。使用表6-2中描述的分析方法,通過hplc分析樣品以測定酶變體的活性。

537、圖3a中的比較性數(shù)據(jù)顯示了反應(yīng)樣品中存在的sirna(1)的相對峰面積%。圖3b顯示了sfp在37℃下預(yù)孵育4h后的殘余酶活性,以相對于在4℃下預(yù)孵育4h的sfp的連接活性表示。在所有條件下,多肽seq?id?no:632都表現(xiàn)出比野生型多肽seq?id?no:2和工程化多肽seq?id?no:288改善的dsrna連接酶活性和熱穩(wěn)定性。

538、工程化dsrna連接酶多肽序列總結(jié)

539、表13提供了本文所述的野生型和工程化dsrna連接酶序列的核酸和氨基酸序列的總結(jié)。表13中的實例和參考中使用的純化標簽是n-末端純化標簽mhhhhhhenlyfqs(seq?idno:669)。

540、表13.

541、

542、

543、

544、

545、

546、

547、

548、

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1