Technology Newsfeed
Tech

Хатуу горимд гарааны бизнесүүд: Оксид. 1-р хэсэг: Техник хангамж

Эхний шатны стартап ямар харагддаг вэ? Ихэвчлэн зөөврийн компьютер дээр ажилладаг хөгжүүлэгчидтэй оффис, санаа бүхий самбар, олон код бичдэг. Заримдаа багийн гишүүд алсаас ажиллаж, виртуал самбар дээр санал бодлоо хуваалцдаг тул физик оффис байдаггүй.

Харин "цэвэр" програм хангамжийн стартап биш, техник хангамжид анхаарлаа хандуулдаг компаниудын талаар юу хэлэх вэ? Саяхан би Сан Франциско дахь шинэ төрлийн сервер барьж буй стартап болох Оксид компьютер компанийн оффисуудыг харлаа. Ажлын орчин, түүнээс цацарч буй эрчим хүч намайг гайхшруулсан. Энэ бол тэдний оффис:

Үйл ажиллагааны үүр: Оксидын үүсгэн байгуулагч, CTO, Брайан Кантрилл Оксидын оффис дээр дутуу баригдсан сервер, техник хангамжийн хэмжилтийн хэрэгсэл, зөөврийн компьютер, кабельтай

Зарим зүйлийг мэдрэхгүйгээр тайлбарлахад хэцүү байдаг бөгөөд үүнд эхний бүтээгдэхүүн дуусч байгаа тул техник хангамж+програм хангамжийн гарааны бизнест байх зэрэг багтана. Өнөөдрийн дугаарт бид Оксидын техник хангамжийг хамарна:

  1. Яагаад шинэ төрлийн үүлэн компьютер бүтээх вэ?

  2. Сүлжээний унтраалгыг эхнээс нь бүтээх

  3. Илүү хурдан барихын тулд "прото самбар" ашиглах

  4. Алсын анхны техник хангамжийн компани

  5. Захиалгат техник хангамж үйлдвэрлэх үйл явц

  6. Цахилгааны инженерүүдийн ач холбогдол (EE)

  7. Техник хангамжийн үйлдвэрлэгчидтэй нягт хамтран ажиллах

Энэ нийтлэлийн доод хэсгийг зарим цахим шуудангийн үйлчлүүлэгчид тасалж болно. Өгүүллийг бүрэн эхээр нь онлайнаар тасралтгүй уншина уу.

Нийтлэлийг бүрэн эхээр нь онлайнаар уншина уу

1. Яагаад шинэ төрлийн үүлэн компьютер бүтээх вэ?

Хэрэв та сая сая хэрэглэгчдэд зориулсан програм эсвэл үйлчилгээг бүтээхийг хүсвэл дэд бүтцийн хоёр үндсэн сонголт байна:

  1. Үүлэн үйлчилгээ үзүүлэгч. AWS, GCP, Azure, Oracle гэх мэт. Бусад газар Uber GCP болон Oracle руу шилжиж байна. өмнө нь хамрагдсан шиг .

  2. Газар дээр нь (урьдчилсан) Өөрийнхөө серверүүдийг ажиллуулах, эсвэл ихэвчлэн дата төвд тавиур түрээслэх. Энэ аргыг заримдаа "хувийн үүл" гэж нэрлэдэг. Бид платформыг хэрхэн, яагаад захиалах талаар авч үзсэн Agoda нь ерөнхий болон түүний хувийн үүл хэрхэн бүтээгдсэн талаар хэвээр байна . Сошиал медиа сайт Bluesky мөн өөрийн мэдээллийн төвүүдийг ашигладаг AWS-г орхисноос хойш.

Дата төвүүдэд хэмжилтийн нэгж нь "нэг тавиур" юм. Тавиур нь хэдэн арван сервер багтаах боломжтой хадгалах нэгж юм; хэлбэр дүрсээрээ ихэвчлэн "пицца хайрцагны сервер" гэж нэрлэдэг. Зузаан төрлүүдийг "хувцас сервер" гэж нэрлэдэг. Хажуугийн тэмдэглэл: пицца хайрцагны серверээс өөр хувилбар юм ирний серверүүдийг ирний хашаанд оруулсан дата төвүүдэд барилгын материал болгон .

Agoda онлайн аялалын захиалгын платформыг маш их ашигладаг "пицца хайрцагны сервер" энд байна:

Agoda серверийг хувийн үүлэндээ ашигладаг. Харна уу Agoda's Private Cloud дотор: 1-р хэсэг

Оксидын оффис дахь зарим түүхий эдийн серверүүд энд байна:

Гигабайт болон Тянь серверүүдийг ажиллуулдаг Оксидын оффис дахь ердийн серверийн тавиур 50% багтаамжтай.

Дээрх зурган дээрх тавиур миний айлчлалын үеэр ажиллаж байсан. Хүлээгдэж байсанчлан чанга байсан бөгөөд маш их дулаан үүсгэсэн бөгөөд маш олон кабель байсан. Харах, ажиллуулахад замбараагүй байна: компьютерийн эрин үеийн программ хангамж нь аюулгүй байдал, найдвартай байдал, гүйцэтгэлийн асуудал үүсгэдэг. "PC-ийн эрин үе" гэдэг нь 1980-аад он буюу 2000-аад оны эхэн үе, өмнөх үеийг хэлдэг x86 64 битийн машинууд сонголт хийх серверүүд болсон.

Бусад газар Big Tech компаниуд өөрсдийн өндөр оновчтой тавиур, серверүүдийг үйлдвэрлэсэн боловч эдгээр нь зарагдахгүй. Meta, Google, Amazon зэрэг компаниуд уламжлалт тавиур ашиглахаа больсон серверүүдээ эрчим хүчний хэмнэлттэй, засвар үйлчилгээ хийхэд хялбар, цөөн тооны кабельтай болгохын тулд "хэт масштабтай" байх.

Google-ийн захиалгаар хийсэн серверүүд. Эх сурвалж: Google

Google-ийн Дата төвийн үйл ажиллагааны дэд захирал Жо Кава 2017 онд эдгээр тавиуруудыг тайлбарлав.

"Манай ихэнх тавиурууд уламжлалт серверийн тавиур шиг харагддаггүй. Эдгээр нь Google-д зориулагдсан бөгөөд бүтээгдсэн тул бид хэт үр ашигтай, өндөр хүчин чадалтай тооцоолох серверүүдийг оновчтой болгох боломжтой."

Big Tech-ийн үүлэн тавиуруудын технологийн дэвшлийг агуулсан үүлэн компьютер бүтээх зорилготой Оксид руу буцах. Хэрэв жижиг технологийн компаниуд Meta, Amazon, Google, Microsoft-ын өөрсдөдөө зориулж бүтээсэн, AWS, GCP, Azure зэрэг томоохон үүлэн үйлчилгээ үзүүлэгчдийн хэрэглэгчид ашигладаг гэх мэт эрчим хүчний хэмнэлттэй серверүүдийг цоожгүйгээр худалдаж авбал яах вэ?

Оксидын компьютер үүнийг санал болгож байгаа бөгөөд би түүний анхны тавиуруудын нэгийг харсан. Энэ нь уламжлалт тавиуртай төстэй хэмжээтэй мэт боловч компани нь уламжлалт тавиураас 33% бага зай эзэлдэг бөгөөд ижил гүйцэтгэлийг санал болгодог. Энэ нь их өдөр тутмын барааны серверээс нам гүм; Харьцуулбал Gigabyte болон Tyan серверүүд чихийг нь хагалах чадвартай бөгөөд ердийн сервертэй харьцуулахад кабель бараг байдаггүй.

Бүрэн ачаалалтай Оксидын тавиурыг хажуу болон хойд талаас нь харах. Цөөн кабель, маш чимээгүй

Уламжлалт тавиуртай харьцуулахад Оксидын компьютерийн ашиг тус:

  • Илүү хурдан суурилуулалт: Уламжлалт тавиур суурилуулах нь ихэвчлэн долоо хоног, сар шаардагддаг гэж Брайан хэлэв, учир нь серверүүдийг суулгаж, холбож, дараа нь турших шаардлагатай байдаг. Оксидын тавиур бүрэн угсарсан ирдэг; зүгээр л дата төвд оруулах хэрэгтэй.

  • Орон зай ба эрчим хүчний хэмнэлт. Бага эрчим хүч хэрэглэж, бага зай эзэлдэг. Дуу чимээ багатай байх нь эрчим хүчний үр ашиг өндөр байгааг илтгэдэг бөгөөд фенүүд нь дулааныг илүү сайн дамжуулдаг тул шаргуу ажиллах шаардлагагүй болно.

  • Уян хатан дэд бүтцийг удирдах нэгдсэн программ хангамжтай. Уламжлалт тавиур дээр суурилуулсан серверүүдийн хувьд виртуал машинуудыг удирдах програм хангамжийг сонгох шаардлагатай VMware , Металл үйлчилгээ болгон , Proxmox виртуал орчин , мөн OpenStack Ironic . Оксидын үүлэн компьютер нь хадгалах зориулалттай суурилуулсан виртуалчлалыг агуулдаг (AWS-тэй дүйцэхүйц). Уян блокны дэлгүүр ) мөн сүлжээ (өөр хувилбар виртуал хувийн үүлс .)

Оксидын зорилтот хэрэглэгч нь зохицуулалт, аюулгүй байдал, хоцрогдол, эдийн засгийн шалтгаанаар томоохон хэмжээний дэд бүтцийг ажиллуулж буй хэн бүхэн юм. Оксидын тавиур нь 2,048 CPU цөмтэй ("чарга" тутамд 64 цөм, нэг чарга нь "арын сервер"-ийн Оксидын хувилбар, 16-32TB санах ой (512 ГБ эсвэл чарганд 1ТБ санах ой) болон 1PB (петабайт) багтаамжтай. хадгалах (чарга тутамд 32ТБ хадгалах сан). Харна уу). бүрэн тодорхойлолт.

Энэ төрлийн тохиргоо нь CPU-ийн олон мянган цөмийг ажиллуулж байгаа компаниудад утга учиртай юм. Жишээлбэл, бид өмнө нь Agoda хэрхэн ажилладаг талаар авч үзсэн үйл ажиллагаа явуулсан 2023 онд өөрийн дата төвүүдэд 300,000 CPU цөм; Оксид гэх мэт тавиуруудад ийм хэмжээний хөрөнгө оруулалт хийх нь утга учиртай байж болох юм. Виртуал машиныг үйлчилгээ болгон зарах бизнес эрхэлдэг компаниуд уламжлалт тавиуруудтай харьцуулахад үйл ажиллагаандаа мөнгө хэмнэх сонирхолтой хөрөнгө оруулалт гэж үзэж магадгүй юм.

Сонирхолтой төрлийн үйлчлүүлэгчид бол олон нийтийн үүлэн сүлжээнд олон мянган CPU цөм ажиллуулж байгаа боловч сүлжээний хоцрогдолд сэтгэл дундуур байдаг компаниуд юм. Нийтийн үүлэнд олон түрээслэх нь улам бүр нэмэгдэж байна; Энд нэг сүлжээний шилжүүлэгч серверүүд хэд хэдэн тавиур болон үйлчлүүлэгчид нь дибаг хийх эсвэл сайжруулах боломжгүй хоцролтыг улам дордуулдаг. Үүний эсрэгээр Оксидын тавиур нь дата төвүүдэд зориулалтын тавиурын зайг санал болгодог.Эдгээр серверүүдийг ашиглах нь сүлжээний хоцролтыг эрс багасгаж чадна, учир нь үйлчлүүлэгч өөрийн бүс нутгийн хэрэгцээнд үндэслэн ашигладаг дата төвөө сонгох боломжтой. Үйлчлүүлэгчид сүлжээ болон техник хангамжийн стекээ бүрэн хянах боломжтой бөгөөд энэ нь үүлэн үйлчилгээ үзүүлэгчийг ашиглах үед хийх боломжгүй зүйл юм.

Оксид нь хэдхэн зуун CPU цөм шаардлагатай жижиг стартапуудад чиглэгддэггүй. Эдгээр бизнес эрхлэгчдийн хувьд үүлэн үйлчилгээ үзүүлэгчдийг ашиглах, эсвэл жижиг нүцгэн металл сервер худалдаж авах/түрээслэх, ажиллуулах нь ухаалаг шийдэл юм.

2. Сүлжээний унтраалгыг эхнээс нь бүтээх

Серверийн үйлдвэрлэлд инноваци хаанаас гардаг вэ? Би Брайанаас асуув:

“Google, Meta болон түүнтэй адилтгах компаниуд илүү сайн сервер бүтээхийн тулд өөрсдийн захиалгат техник хангамж, программ хангамжийг үйлдвэрлэдэг компаниуд зах зээлд өрсөлдөөнийг авчирч чадна. Гэсэн хэдий ч эдгээр компаниуд серверээ арилжааны бүтээгдэхүүн болгон гаргах магадлал багатай. Энэ нь тэдний бизнесийн загвар биш юм.

Тэгэхээр, үгүй, серверийн дараагийн томоохон инноваци нь Google эсвэл үүнтэй төстэй компаниас гарахгүй. Энэ нь гарааны бизнесээс гарах болно. Тэгээд бид тэр стартап болохыг хүсч байна."

Оксид нь унтраалга болон сервер гэсэн хоёр техник хангамжийг эхнээс нь зохион бүтээх ёстой байв.

Гуравдагч этгээдийн шилжүүлэгчийг нэгтгэхийн оронд яагаад унтраалга барих ёстой вэ?

Оксидын эрхэм зорилго нь өөрсдийн үүлэн компьютерийг бүтээх явдал юм. Захиалгат сервер бий болгох гэдэг нь ихэвчлэн системийн бэлэн эд ангиудыг авч, серверийн явах эд анги, лавлагааны дизайны системийн самбар, тусад нь боловсруулсан сүлжээний унтраалга зэрэг бүгдийг нэгтгэхийг хэлдэг. "Ашигласан загвар" нь түүний элементүүдийг хаана байрлуулах талаар иж бүрэн зааварчилгааг агуулсан системийн зураг төсөл бөгөөд зориулалтын дагуу ажиллах нь батлагдсан: хэт халах, гэнэтийн хөндлөнгийн оролцоо үүсгэх ёсгүй.

Гэсэн хэдий ч Оксид нь өөрсдийн сүлжээний унтраалга бүтээхээс гадна захиалгат сервер бүтээх шаардлагатай байсан нь нэлээд ажил юм! Энэ хэрэгцээ нь Оксид техник хангамжийн стекийг бүхэлд нь, төгсгөл хүртэл удирдахыг хүссэн хязгаарлалтаас үүдэлтэй. Сүлжээний унтраалга нь өөрөө "мини-компьютер" юм. Тиймээс бодит байдал дээр тэд зөвхөн нэг биш хоёр компьютер зохион бүтээж, бүтээсэн.

Тусдаа унтраалга үйлдвэрлэх нь солих програмын тусгай нэгдсэн хэлхээг нэгтгэх гэсэн үг юм ( ASIC ), удирдлагын CPU, цахилгаан хангамж, физик сүлжээний портууд.

Оксидын энэхүү шилжүүлэгчийн зорилго нь:

  • Өндөр боломжтой ажиллагаа. Оксидын тавиур бүр нь өндөр хүртээмжийн дагуу нэгэн зэрэг ажилладаг хоёр сүлжээний унтраалгатай. Хэрэв нэг шилжүүлэгчийн холбоосууд асуудалтай эсвэл шилжүүлэгчийг засварлах шаардлагатай бол серверүүд нөгөө унтраалгаар дамжуулан сүлжээнд нэвтэрч, нэг унтраалгатай тохиргооноос илүү найдвартай ажиллагааг хангах боломжтой.

  • Удирдлагын онгоцны программ хангамжтай нэгтгэсэн. Оксидын шийдвэрийн цорын ганц чухал хүчин зүйл бол олон түрээслэгчийн уян хатан дэд бүтцийн чанарын эцсийн туршлагыг хүргэх хүсэл байв. Тус багийнхан нийтийн үүлэн дэд бүтцийг ашиглах туршлагаасаа харахад шилжүүлэгч нь ихэвчлэн найдвартай байдал, гүйцэтгэлийн асуудлуудын холбоо болдог гэдгийг мэддэг байсан.

  • Сервертэй ижил "үндсэн" техник хангамжийг ашигла. Шилжүүлэгч нь Оксидын серверүүдтэй ижил зохицуулагч болон тэжээлийн хянагчийг ашиглах ёстой.

Захиалгат сүлжээний унтраалгыг бүтээхэд 2020 оны 3-р сард дизайн хийхээс эхлээд 2022 оны 1-р сард угсарсан анхны нэгж хүртэл 2 жил орчим хугацаа зарцуулсан.

"Sidecar" код нэртэй Оксидын сүлжээний шилжүүлэгчийн анхны бүтээн байгуулалт
Sidecar-ийн анхны инженерийн барилгын урд талын зураг

Захиалгат техник хангамжийг бүтээх нь бараг үргэлж гэнэтийн сорилтуудтай тулгардаг. Сүлжээний шилжүүлэгчийн хувьд дээрх зураг дээр шар туузаар тэмдэглэгдсэн самбар дээрх буруу хүчдэлийн зохицуулагчийг тойрон ажиллах шаардлагатай болсон.

3. Техник хангамжийг илүү хурдан бүтээхийн тулд прото самбар ашиглах

Прото самбар нь "прототип хэвлэмэл хэлхээний самбар" гэсэн үгийн товчлол бөгөөд энэ нь компанид жижиг эд ангиудыг бие даан ажиллахад нь тусалдаг. Баталгаажуулсны дараа тэдгээр бүрэлдэхүүн хэсгүүдийг барилгын материал болгон ашиглаж болно.

"Бид серверийг эхнээс нь бүтээхээр зорьж байхдаа серверийн эх хавтанг бүтээхэд шууд очихыг хүсээгүй. Гэсэн хэдий ч, бид эхлэхэд бүрэн цагийн цахилгаан инженерүүд тэг байсан!"

Өмнөх ажил дээрээ робот техникийн хүмүүсээс сурсан үйл явц байдаг бөгөөд үүнийг "замын аллага" гэж нэрлэдэг. Та эцэст нь барьж буй зүйлдээ хүрэх бүх эд ангиудыг олж авдаг, гэхдээ тэдгээрийг нэгтгэхийн оронд бүгдийг нь хооронд нь муухай кабель бүхий вандан сандал дээр тарааж, шалгаж, нудрах, солих боломжтой. Үүнийг серверүүдэд зориулж хийх нь зүйтэй гэж бид бодсон."

Анхны прототип самбар

Анхны прототип хэвлэмэл хэлхээний самбарын хувьд баг нь үйлчилгээний процессороос эхэлсэн. Энэ бол сервер болон шилжүүлэгчийн маш сайн ойлгогдсон, маш чухал хэсэг байсан. Баг үүнийг бэлэн байгаа хоёр микроконтроллероос бүтээхээр шийдэж, үүний эргэн тойронд прототип самбар бүтээжээ.

Эхлэхдээ тус компани робот техникээс санаа авсан. Үүсгэн байгуулагч инженер Клифф Л. Биффл, хувьцаа :

Серверийн бүрэлдэхүүн хэсгүүдийн хоорондох бүх харилцаа холбоог хөнгөвчлөх үйлчилгээний процессорын прототип самбар

Прототип хэлхээний самбартай байсан ч зажилж чадахаасаа илүү хазах боломжтойг багийнхан олж мэдэв. Эхний самбар нь амжилттай ажиллаж чадсан: ажиллаж эхэлмэгц техник хангамж, программ хангамж нь "гарч ирсэн" (цахилгаан инженерийн хувьд "болох" гэдэг нь цахим системийн самбарыг амжилттай асааж, эхлүүлэхийг хэлдэг.) Гэхдээ хөгжүүлэхэд зарцуулсан хугацаа нь багийн хүссэнээс урт байсан.

Энэхүү прототипийн самбар нь хэт олон хөдөлгөөнт эд анги, хэт олон оролт/гаралтын зүү бүхий хэт өндөр нэгдсэн байсан нь харагдаж байна. Самбар дээр бүтээмжтэй байхын тулд хэтэрхий их зүйл байсан. Олон функцтэй, олон тогтмол функцтэй нэг төвөгтэй самбарын оронд олон, энгийн техник хангамжийн модулиудын хувьд ахиц дэвшил илүү хурдан байх болно гэдгийг баг мэдсэн. Инженерийн хувьд. Рик Алтерр - Удирдах зөвлөлд хэн ажиллаж байсан - тэмдэглэсэн :

"Бид хэтэрхий олон зүйлийг өмссөн. Бидний олж мэдсэн ойлголт бол бүх удирдлагатай x86 сервер нь хэтэрхий төвөгтэй юм. Үүнийг зөвхөн удирдлагын дэд системүүд рүү шилжүүлье. Энэ самбар нь үйлчилгээний процессор байх зорилготой юм. Гэхдээ энэ нь хэтэрхий их юм.

Нэг самбар дээр маш олон зүйл залгахад тохиромжтой модулиудын оронд байгаа нь бид дизайны олон сонголтыг хийсэн гэсэн үг юм. Жишээлбэл, бид ТУЗ-ийг үйлдвэрлэлээс буцааж авахаас өмнө энэ нь хэрхэн ажиллах тухай философийг өөрчилсөн учраас хоёр ethernet үүрийг хэзээ ч ашиглаж байгаагүй."

Илүү модульчлагдсан арга

Үйлчилгээний процессорын самбарыг барихын өмнө баг нь "итгэлийн үндэс" (RoT) функцийг тусдаа самбар дээр тусгаарласан. RoT техник хангамж нь бүхэл бүтэн системийн аюулгүй байдал, итгэлцлийг бий болгох үндсэн суурь юм. RoT нь "анхны зааварчилгааны бүрэн бүтэн байдал"-тай бөгөөд энэ нь эхлүүлэх үед яг ямар зааварчилгааг гүйцэтгэдэг болохыг баталгаажуулдаг. RoT нь аюулгүй ачаалах төхөөрөмжийг байнга түгжиж, байнгын аюулгүй ажиллагааг хангадаг. Доорх нь Оксидын RoT модулийн прототип юм.

Итгэлцлийн модулийн үндэс; тусдаа, залгах боломжтой прототип

Оксидын багийн бүтээсэн бусад модулиудад тэжээлийн модуль, мультиплексер (олон оролтын дохио бүхий төхөөрөмж, гаралт руу ямар дохио илгээхийг сонгодог):

Оксидын баг прототип, туршилт хийх олон модулиудыг бүтээсэн

Цаг хугацаа өнгөрөхөд баг прототипийн самбарт хэр их функц шаардлагатай байгаа талаар зөв тэнцвэрийг олсон. Үйлчилгээний процессорын боловсруулсан прототип самбарын хувилбарыг доор харуулав.

Прототип үйлчилгээний процессорын хувьссан хувилбар. Ethernet гэх мэт илүүдэл портууд байхгүй байна

Оксидын баг энэ самбарыг "ажлын морь" гэж нэрлэдэг, учир нь тэд маш олон модулийг залгаж, түүгээр маш их туршилт, техник хангамж, програм хангамж хөгжүүлэх боломжтой. Энд жишээ байна:

Модульчлагдсан хөгжүүлэлтийн техник хангамжийн хувилбар: модулиудыг залгасан прототип үйлчилгээний процессорын самбар

Прототипийн самбар нь техник хангамжийн нэгжийн туршилт юм. Програм хангамж боловсруулахдаа нэгжийн туршилтууд нь системийг өөрчилснөөр бүрэлдэхүүн хэсгүүд зөв ажиллаж байгаа эсэхийг баталгаажуулдаг. Оксид прототипийн хавтангууд энэ аргад нэлээд ойртож байгааг олж мэдсэн бөгөөд Оксид нь туршилтын төхөөрөмж үйлдвэрлэх, баталгаажуулахаас илүү техник хангамжийн дизайн дээр илүү хурдан давтагдах боломжийг олгосон.

Илүү хурдан давтахын тулд ухаалаг шийдлийг ашиглах

Дэлгэрэнгүй унших